t 



REP I I Q U E FRANQAI 



R#FR0 3 / 02 7 6 3 

BSC'd PCT/PT9 13 MAR 2005 




BREVET D ' INVENTION 



CERTIFICAT D'UTILITE - CERTIFICAT D'ADDITION 



CQPiE OFFICIELLE 



\ 9 



, .»■ J . 
■■•jlV.' 



Le Directeur general de IMnstitut national de la propriete 
industrielle certifie-que W document: ci-anne)0 est la copie 
certffiee! qo nf o rrri e d ' u he d e ma n d e de^t^rde propriete 
industnelie^ep^ 



Fait & Paris, le . 



i 5 inn 2003 



DOCUMENT DE PRIORTTE 

PRESENTE OU TRANSMIS 
CONFORMEMENT A LA 
R£GLE17.1.a)OUb) 



Pour le Directeur general de I'lnstitut 
national de la propriete Industrielle 
Le Chef du Departement des brevets 




Martina PLANCHE 



SIEGE 

INSTITUT 26 bis, rue de Saint Petersbourg 
NATIONAL DE 75800 PARIS cedex 08 
national Telephone: 33 (0)1 53 04 53 04 

LA PROPRIETE TeJecople : 33 (0)1 53 04 45 23 
INDUSTRIELLE www.lnpifr 



i 




tunottu oi 
irtoirtTMiuo 



26 bis. rue de Saint Petersbourg 
75800 Parts Cedex 08 

Telephone : 01 53 04 53 04 Teleoopie : 01 42 94 86 54 



uemSe^ 



BREVET ©'OSaVEMTIOM 
CEOTFSCAT D'UTOLITE * 11354-01 

Code de la propriete Intellectueile - Livre VI 

REQU&TE Efo D&UVRANCE 1/2 
Cet tmprime est a remplir lisiblement j I'encre noire obs4o\v/260399 



date 



7§ INP1 PARIS 



k *su. ATraieyt par linpi 

HATV Qfc o£PfJT ATTRIBUTE 
PAR CINPI 



©2 1 1@T© 

2 0 SEP. 2002 



fftHronces pour c© dossier 

tjnr^iuij) b I4143 EE 62959 



33 NOM ET ADRESSE DU DEMANDEUR OU DU MANDATAIRE 
A QUI LA CORRESPONDANCE DOIT 6TRE ADRESSEE 

BREVATOME 

3, rue du Docteur Lancereaux 
75008 PARIS 
422-5/S002 



O^trmation d'un depdt par telecople □ N° attribue par i'lNPl a ta telecopie 



M: mature de la desviakde 



Cochez Tune des 4 cases suhrantes 



Qemande de brevet 



0 



Demande de certlficat d'uti!it§ 



□ 



Demande divlsiorinaire 

Demande de brevet initiate 



□ 



Date ; L. L :• 



Transformation d'une demande de 
brevet europeen Demande de brevet initiate 


"Tr Date I L . J ~* 


g| TITRE DE L'INVENTIOM (200 caracteres ou espaces maximum) 

SYSTEMES D'EXPRESSION DE PROTEINES TOXIQUES, VECTEURS ET PROCEDE DE 
FABRICATION DE PROTEINES TOXIQUES 


M DECLARATION DE PRIORITY 
OU REQUITE DU B£n£FICE DE 
LA DATE DE DEP&T D'UNE 
DEMANDE ANTfe RIEURE FRAS^QAISE 


Pays ou organisation 

Date : jL..„/, J N° 

Pays ou organisation 

Date } / / N° 

Pays ou organisation 

Date ,.. .L-..1. N° 

□ S'il y a d'autres priorftes, cochez la case et utilises Hmprime «Suite» 


M DEfWANDEUR 


| | S'il y a d'autres demandeurs, cochez la case et utilises I'imprime «§urte» 


Norn ou denomination sociale 


CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 


j Prenoms 




Forme juridique 




N° SIREN 




Code APE-NAF 


. - ■ I 


Adresse 


Rue 


3, rue Michel Ange 


Code postal et ville 


75794 PARIS CEDEX 16 


Pays 


FRANCE 


Nation a lite 


Francaise 


N° de telephone (facultatij) 




N° de telecopie (facidtatij) 




Adresse electronique (facidtatij) 





I 



UAnOOALDC 



B&EMET ©'GSWE!N3YQ<0>S 
CECT1FICAT D'UTIUTE 

REQUgTEB^DaJVRAMCE 2/2 




(RteetvaariNPit 



"""SflFSEPT 2002 



DATE 

UEU 75 INPI PARIS 

H* O'ENREGISTREMEHT 



02 11 B7& 



OBS40W/260S99 



Vos r6f e>ences pour ce dossier : 

(faailtatij) 


B 14143 EE 62959 


11 fiiiANDATAIRE 




Nom 


AUDffiR 


| Prenorn 


Philippe' - * 


Cabinet ou Societe 
• 


BREVATOME 

422-S/S002 . * 


N °de pouvoir permanent et/ou 
de lien contractile! 




Adresse 


Rue 


3, rue du Docteur Lancereaux 


Code postal et ville 


75008 | PARIS 


N° de telephone (facultatif) 


01 53 83 94 00 


N° de telecopie (facultatif) 


01 45 63 83 33 


Adresse electronique (facultatif) 


brevets.patemts^brevalex.com 


fg INVENTEUR (S) 




Les inventeurs sont les demandeurs 


y 


Oul 

Non Dans ce cas foumir une designation d'inventeur(s) separee 


O RAPPORT DE RECHERCHE 


Uniquement pour une demande de brevet (y compris division et transformation) 


£tablissement immedlat 
ou etablissement differe 


m 
□ 


Paiement echelonne de la redevance 


Paiement en trois versements, uniquement pour ies personnes physiques 

□Oul 
□Non 


H REDUCTION DU TAUX 
DES REDEVANCES 


Uniquement pour les personnes physiques 

dRequlse pour la premiere fois pour cette invention (joindre un avis de non-imposition) 
□Requise anterieurement a ce depdt (joindre une copie de la decision ^admission 
pour cette invention ou indiquersa reference) : 







Si vous avez utilise Fimprime «Suite» f 
indiquez le nombre de pages jointes 



M SIGNATURE DU DEMANDEUR 
OU DU MANDATA1RE 
(Nom et qualtte du signataire) 



P. AUDIER 




VISADE LA PREFECTURE 
OU DE LMNP1 



La loi n°78-17 du 6 janvler 1978 relative a I'informatique, aux fichiers et aux liberies s'applique aux reponses faites a ce formulaire. 
Elie garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de IMNPL 



SYSTEMES D' EXPRESSION DE PROTEINES TOXIQUES, VECTEURS 
ET PROCEDE DE FABRICATION DE PROTEINES TOXIQUES 

DESCRIPTION 

DOMAINS TECHNIQUE 

La presente invention se rapporte S des 
systemes d' expression de proteines toxiques, 5. des 
vecteurs d' expression comprenant un de ces . systemes, a 
des cellules procaryotes transf ormles par ces systdmes, 
ainsi qu'4 un procgde de synthase' d'une proteine 
toxique utilisant ces systdmes d' expression. 

Elle permet par exemple la surproduction dans 
une cellule procaryote, par. exemple Escherichia, coli 
{E.coli), de prolines ou peptides hydrophobes 
toxiques, par exemple la surproduction de domaines 
transmembranaires de proteines d'enveloppe de virus. 

Elle trouve de nombreuses applications 
notamment dans la recherche concernant les mecanismes 
d' infections virales et dans recherche et la mise au 
point de nouveaux principes actifs pour lutter contre 
les infections virales. 

Dans la description qui suit, les references 
entre crochets [ ] renvoient k la liste de references 
annexe e . 

Etat de la technique 

La determination de la structure 

tridimensionnelle (3D) est une etape decisive dans la 
comprehension structurale et f onctionnelle des 
proteines . 
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De tres grands efforts et moyens ont ete, et 
sont, mis en oeuvre pour parvenir a ce but, et se sont 
amplifies avec 1 ' accumulation des donnees apport£es par 
les programmes de sequengage des genomes [1] . 
5 Les deux principales techniques permettant 

1'etablissement de ces structures des proteines sont la 
diffraction des rayons X, realis6e a partir de 
prolines cristallisees , et la resonance magnStique 
nucl6aire (RMN) effectuee a partir de^ protSiiies en 
10 solution. La RMN, fcden adaptee a 1' etude cie proteines 
de masse molec^laire infgrieure^ & 20 kDa, necessite 
cependant, comme la diffraction des. RX, la production 
de grandes quantit^s de materiel. Elle implique en 
outre dans la plupart des cas de preparer du materiel 
15 enrichi en 15 N et/ou 13 C. 

Dans ce contexte, la bact£rie est un moyen de 
production largement utilise par la communautl 
scientif ique [2] . La surexpression de proteines dans la 
bacterie ne s'effectue cependant pas sans prpblSmes . En 
2 0 effet, elle donne lieu a trois cas de figures : 

Le premier cas, ideal, est celui ou la 
proteine est surproduite sous une forme correctement 
repliee dans 1'espace lors de sa synthese in vivo- Ce 
n'est pas une situation rare, mais elle n'est pas 
25 frequente non plus. Elle concerne essentiellement les 
protSines solubles et de taille reduite, c'est a dire 
d' environ 20 & 50 kDa. 

Le deuxiSme cas, le plus courant, est celui 
o-Cl la proteine est surproduite et agreg£e sous la forme 
30 de corps d' inclusion. Cela concerne les proteines 
polytopiques et/ou de grande taille. Dans ce cas, la 
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cinetique de repliement de la protSine est netteraent 
plus lente que sa vitesse de biosynthese, Cela favorise 
1' exposition au solvant aqueux des regions hydrophobes 
de la proteine qui sont normalement enfouies au coeur 
de celle-ci, et genere des interactions non specif iques 
qui conduisent 3. la formation d'agregats insolubles* 
Suivant le degre de desordre de ce repliement, les 
corps d' inclusions peuvent Stre solubilisSs/d^plies 
dans des conditions non natives, avec de l'uree ou de 
la guanidihe. La proteine 'solubilisee est ensuite 
soumise* a differents traitements, comme la dialyse ou la 
dilution pour favoriser, dans certains ca:s avec succes/ 
un repliement 3D natif . 

Le troisidme cas est celui oil 1' expression 
engendre une toxicite d'un degr£ variable. Celui-ci va 
de 1' absence de produit. d' expression si la bact^rie 
parvient a s' adapter, a la mort de celle-ci si le 
produit est trop toxique. C'est un cas qui se prSsente 
assez frequemment et le plus souvent avec des proteines 
ou des dotnaines de proteines membranaires , comme par 
exemple ceux des proteines d'enveloppe du virus de 
1' hepatite C [5] ou du virus d' immunodef icience humain 
[6] . 

Le probleme de toxicity concerne 

essentiellement 1' expression de proteines membranaires, 
c'est a dire de proteines presentant un domaine 
hydrophobe. Or ces proteines presentent un int^rSt 
grandissant. Elles sont d'une part relativeraent 
nombreuses puisque 1' etablissement des differents 
genomes confirme qu' elles representent environ 30% des 
proteines potentiellement cod£es par ces genomes [7] . 
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Elles constituent d # autre part 70% des cibles 
therapeutiques et leur alteration est k l'origine de 
nombreuses maladies gene ti que s [8] . 

II est done essentiel de mettre au point des 
methodes facilitant ou permettant 1' expression de 
telles protSines ou de leur partie membranaire. 

Des efforts ont ete faits dans ce sens avec par 
exemple la mise au point de souches bacteriennes, soit 
"tolerant mi eux 1' expression de prot^ines membranaires 
{9, 10], soit ayant une regulation plus stricte du 
mScanisme d' expression comme dans ie cas de la souche 
E. coli BL21 (DE3)pLysS d^veloppee par Stratagene. 
Cependant, ces ameliorations ne permettent pas de 
supprimer le ph6nom£ne de toxicity dans tous les cas, 
en particulier lors de 1' expression de peptides 
hydrophobes correspondant a des ancres membranaires. 

L'un des enjeux medicaux majeurs actuels 
concerne le traitement de 1' hepatite C. Celle-ci est 
provoqu^e par le virus de 1' hepatite C (VHC) de la 
famille des flaviviridae et qui infecte specif iquement 
les cellules h<§patiques [11] • Ce virus est constitue 
d'un ARM posit if d' environ 9500 bases qui code pour une 
polyproteine de 3033 resides [13] , symbolist sur la 
figure 1 annexe par le rectangle 1A. Cette polyproteine 
est clivee apres expression par des proteases endogenes 
et exogenes pour donner naissance a 10 proteines 
diff^rentes. Deux d'entre elles, appelees El et E2, 
sont glycosylees et forment 1'enveloppe du virus. Elles 
possedent chacune des domaines membranaires appeles TM, 
en particulier TME1 pour la proteine El et TME2 pour la 
proteine E2 . Les positions de clivage qui les g6nerent 
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sont indiquges sur la figure 1 par cies f leches avec, 
mentionne au-dessous, un norabre qui correspond a la 
position dans la polyprot^ine du premier acide amine de 
sequence resultant, du clivage. Les proteines El et E2 
sont symbolis€es par un rectangle. La partie blanche de 
chaque rectangle correspond 3. 1 1 ectodoraaine (ed) et la 
partie grisee. a la region' transmembranaire (TM) . La 
sequence primaire des TM est.indiquee dans le bas de la 
figure en code a une lettre, avec des nombres 
correspondant 3. la position des acides. amines dans la 
polyprot€ine situes aux extremites de ces domaines. Les 
Stoiles indiquent. les acides aminSs hydrophobes. Ces 
domaines membranaires ou regions membranaires du virus 
ont des propri^tes d' association particuli^res qui 
conditionnent la structuration de l'enveloppe du virus 
[12] . A ce titre, ils constituent des cibles 
th^rapeutiques potentielles . La comprehension du 
tnecanisme d' association du virus nScessite des 6tudes 
de la structure 3D de ces domaines notarament par les 
techniques prScitees, ce qui implique de produire ces 
peptides en quantity abondante, et en plus de 
preference par voie biosynth^tique pour perraettre un 
marquage isotopique 15 N et/ou 13 C. 

Les diffSrents essais d' expression de El de 
I'.art anterieur, notamment dans E. coll [14] [5] ou dans 
des cellules d' insecte sf9 inf ectees par baculovirus 
[15] , n'ont pas permis de surproduire cette proteine 
El, notamment du fait de la toxicite induite par son 
expression, y compris dans les souches E. coli 
BL21 (DE3)pLysS dites «c resistantes decrites ci- 

dessus. II n'y a pas eu d'essai de surexpression de la 
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proteine E2 dans la bacterie. Ces problemes de toxicite 
sont essentiellement dus a la region C-terminale des 
deux proteines, riche en acides amines hydrophobes qui 
forment des domaines transmenibranaires assurant 
1'ancrage a la membrane du reticulum endoplasmique . 

II existe done un reel besoin pour un systeme 
d' expression de proteines toxiques qui ne presente pas 
les inconv^nients, limitations, defauts et desavantages 
des techniques de l'art ant6rieur. 

En outre, il existe un reel besoin d'un vecteur 
d f expression comprenant un tel systdme d' expression de 
proteines toxiques permettant de mettre en oeuvre un 
proc€de de fabrication de proteines toxiques qui ne 
prSsente pas les inconv6nients, limitations, defauts et 
desavantages des techniques de 1'art ant€rieur. 

EXPOSE DE L' INVENTION 

Le but de la presente invention est precisement 
de fournir un systdme d' expression d'une proteine 
toxique, qui rSponde, entre autres, aux besoins 
indiqu^s ci-dessus. 

Ce but, et d' autres encore, sont atteints, 
conformement & 1' invention, par un systeme d' expression 
caracterisg en ce qu' il comprend successivement , dans 
le sens 5' -3', une sequence nucleotidique codant pour 
le dipeptide Asp-Pro, appel^e ci-dessous sequence dp, 
et une sequence nuclSotidique (pt) codant pour une 
proteine toxique (Pt) . Ce systdme sera identif ie ci- 
dessous par : dp-pt. 

Selon un mode particuli^rement prefere de la 
presente invention, le systeme d' expression comprend en 
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outre, en amont de la sequence dp, une sequence 
nucleotidique (ps) codant pour une proteine soluble 
(Ps) . Cette proteine soluble peut §tre par exemple la 
glutathion S -transferase (GST), ou la thioredoxine (TrX) 
5 ou une autre prot6ine soluble equivalente. Ce systerne 
d' expression selon 1' invention sera identifie ci- 
dessous par.: ps-djp-ptJ 

Le systerne d' expression dp-pt de la presente 
invention, qui comiprend^ une sequence codant pour Asp- 
10 Pro (DP en code a une lettre) placSe en amont de la 
sequence nucleotidique de la proteine toxique, perraet 
de maniere tout a fait inattendue de supprimer l'effet 
toxique de la proteine pour la cellule hote. En outre, 
les inventeurs ont note que, de maniere tout a fait 
15 ' surprenante, la suppression de toxic it e- de la prot6ine 
chez I'hdte est encore plus efficace avec le systerne. 
d' expression ps-dp-pt, lorsque le peptide toxique est 
produit en fusion C-terminale avec une proteine 
soluble, par exemple la glutathion S-transf erase ou la 
20 thioredoxine, avec la sequence Asp-Pro inseree entre la 
proteine soluble et le peptide toxique ♦ 

Le systfeme d' expression dp-pt ou ps-dp-pt de la 
presente invention permet la surproduction de proteines 
toxiques dans des cellules h6tes, en particulier de 
2 5 protSines hydrophobes, notamment de peptides qui 
correspondent h, ou qui comprennent, des domaines 
hydrophobes de protSines ancr^es aux membranes, II peut 
s'agir par exemple d'une proteine niembranaire ou un 
domaine d'une proteine merabranaire . II peut s'agir par 
30 exemple d'une proteine d' un virus, par exemple d'un 
virus de 1' hepatite C, d'un .virus du sida, ou de tout 
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autre virus pathogene pour l'humain et de maniere 
ggn6rale pour les mammif eres . 

Par exemple, le systdme dp-pt ou ps-dp-pt de 
1' invention permet de surproduire chez un hote tel que 
E.coli les domaines transmembranaires des proteines El 
et E2 du virus de 1 'hepatite C, appelees TME1 et TME2 , 
correspondant respect ivement aux sequences : 

TME1 : . 347 - MI AGAHWGVIAGIAYFSMVG 383 
Sequence IDn°l 

TME2 : 7 1 7 - ME YVVLLFLLLADARVCSCLWMMLL I SQAEA -746 

Sequence IDn°2 

alors que cela n'etait pas possible avec les 
techniques de l'art ant^rieur, 

Les sequences nucl^otidiques utilisables pour 
constituer le systdme dp-pt de 1' invention codant pour 
les proteines TME1 (dp-pt (TM ei) ) ou TME2 (dp-pt {T mk2) ) 
peuvent §tre toutes les sequences possibles codant 
respect ivement pour les proteines de fusion DP-TME1 et 
DP-TME2 . Les sequences codant pour les proteines TME1 
et TME2 peuvent §tre par exemple, avantageusement , 
respect ivement, des sequences IDn°3 et IDn°4 de la 
liste de sequences annexle. Pour obtenir le systdme 
dp-pt la sequence dp codant pour le dipeptide Asp-Pro 
(DP) est ajoutee & ces sequences- 

Les sequences nucleotidiques utilisables pour 
constituer le systeme ps-dp-pfc de 1' invention codant 
pour les proteines TME1 (ps-dp-pt {TME i) ) ou TME2 (ps-dp- 
pt ( TME2>) peuvent etre toutes les sequences possibles 
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codant respectivement pour les proteines de fusion Ps- 
DP-TME1 et Ps-DP-TME2. II peut s'agir par exemple, 
avantageusement, des sequences IDn°34, IDn°35 et IDn 6 36 
de la liste de sequences annexee pour TME1 , permettant 
5 d'obtenir une protSine chimere Ps-DP-TMEl. II peut 
s'agir par exemple, avantageuseraent, des sequences 
IDn°37, IDn°38 et IDn°39 ' de la liste de sequences 
annexee pour TME2 , permettant d'obtenir une proteine 
chimdre PS-DP-TME2 . 
10. En effet, les sequence's nucleotidiques 

pr€citees presentent K des codons optimises pour . 
1' expression de TME1 et TME2 dans une . bact6rie, par 
exemple chez E.coll. 

II existe un grand nombre de sequences de 1'ARN du 
15 VHC produisant un phenotype infectieux : ces sequences sont 
Sgalement utilisables dans la presents invention. 

La sequence codant pour le dipeptide Asp- Pro peut 
§tre par exemple : gacccg, ou toute autre sequence codant 
pour ce dipeptide. 
20 La sequence codant pour la GST peut §tre par 

exemple celle pr§sente dans les plasmides pGEXKT dont la 
sequence correspond It la sequence IDn°29 de la liste de 
sequence annexee ou toute sequence gquivalente, c'est a dire 
codant pour cette protSine soluble. La sequence codant pour 
25 la TrX peut Stre par exemple celle prSsente dans le plasmide 
d' expression pET32a+ dont la sequence correspond a la 
sequence IDn°3 0 de la liste de sequence annexSe ou toute 
sequence Squivalente, c'est a dire codant pour cette 
proteine soluble , 
3 0 Pour la fabrication de la proteine toxique, le 

systdme d' expression dp-pt ou ps-dp-pt de 1' invention 
est place a l'interieur d'une cellule h6te par exemple 
par clonage dans un plasmide appropriS et ceci par les 
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techniques habituelles de transformation d'un h6te dans 
les techniques de recombinaison genetique. 

Le plasmide dans lequel le systetne d' expression 
de la presente invention peut etre clone pour former ce 
5 vecteur sera choisi notamment en fonction de la cellule 
h6te. II peut s'agir par exemple du plasmide pT7-7 
(sequence IDn°33 de la liste de sequences annexee) , 
d'un plasmide de la s£rie pGEX (par exemple de sequence 
IDn°31 de la liste de sequences annexee), commercialism 
10 par exemple par la soci^te Pharmacia, ou un plasmide de 
la serie *pET32 (par exemple de sequence IDn°32 • de la 
liste de sequences annexee), commercialism par exemple 
par la society Novagen. 

Les plasmides de la s<§rie pGEX et de la serie 
15 pET32 seront avantageusement utilises pour la mise en 
oeuvre de la presente invention. En effet, ils 
comprennent d6j& une sequence ps codant pour une 
proteine soluble (Ps) , respectivement pour la 
glutathion S-transf erase et pour la thioredoxine . 
20 Aussi, avantageusement, le systSme dp-pt sera clon§ 
dans ces plasmides en aval de cette sequence ps codant 
pour la protSine soluble* 

La prSsente invention se rapporte done 
egalement a un vecteur d' expression comprenant ion 
25 systdme d' expression selon 1' invention dp-pt ou 
ps-dp-pt ; en particulier un vecteur comprenant un 
systdme d' expression dp-pt selon 1 ' invention et la 
sequence oligonucleotidique du plasmide pT7-7, ou un 
vecteur comprenant un systdme d' expression ps-dp-pt 
30 selon 1' invention et la sequence oligonucleotidique 
d'un plasmide pGEX ou d'un plasmide pET32 . 
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Par exemple, les vecteurs d' expression de la 
presente invention, convenant a un hote bactSrien tel 
que E. coli, et permettant la surexpression de la 
protSine membranaire TME1 precit6e, peuvent • avoir 
5 avantageusement une sequence oligonucleotidique choisie 
parmi les sequences IDn°40 (avec pGEXKT) , IDn°42 (avec 
pET32a+) et IDn°44 (avec' pT7-7) de la liste de 
sequences annexe e . 

Par exemple, les vecteurs d' expression de la 
10 presente invention, convenant a un h6te bact^rien tel 
que E. coli, et permettant la surexpression de la 
proteine membranaire TME2 precitee, peuvent avoir 
avantageusement une sequence oligonucleotidique choisie 
parmi les sequences IDn°41 (avec pGEXKT) , IDn°43 (avec 
15 pET32a+) et . IDn°45 (avec pT7-7) de la liste de 
sequences annexe e . 

En effet, les vecteurs d' expression precites 
prlsentent des codons optimises pour 1' expression des 
prot^ines chimeres de la pr6sente invention, incluant 
20 TME1 et TME2 , dans une bacterie, par exemple chez E. 
coli. 

La presente invention se rapport e 6galement a 
une cellule procaryote transform<§e par un vecteur 
d' expression selon 1' invention- Cette cellule 

25 procaryote transform^ par le vecteur d' expression de 
la presente invention doit de preference permettre la 
surexpression de la proteine toxique pour laquelle code 
le vecteur. Ainsi, toute cellule h6te capable de 
d'exprimer le vecteur d' expression de la presente 

30 invention est utilisable, par exemple E.coll, 
avantageusement, la souche E. coli BL21 (DE3)pLysS . 



B 14143 EE 



12 



La presente invention se rapporte egalement a 
un procedS de fabrication d'une proteine toxique par 
recombinaison genet i que comprenant les etapes 
suivantes : 

transformer une cellule hote avec un 
vecteur d' expression selon 1' invention, 

cultiver la cellule hote transformee dans 

des conditions de culture telles qu'elle fabrique une 

proteine de fusion comprenant le dipeptide Asp-Pro 

* • 
suivi de la sequence' peptidique de la proteine toxique • 

^ partir dudit^ vecteur d' expression, et 

isoler ladite proteine de fusion/ et 

cliver ladite proteine de fusion pour 

r6cup£rer la proteine toxique* 

Les 6tapes de transformation, de culture, ainsi 

que de 1' isolement de la proteine chitnere fabriqu6e 

peuvent §tre r<§alis£es par les techniques habituelles 

de recorabinaison g^netique, par exemple par des 

techniques telles que celles qui sont decrites dans le 

document [25] . 

L'Stape consistant a isoler la proteine de 

fusion peut §tre r£alis€e par les techniques 

habituelles connues de 1'homme du metier pour isoler 

une proteine d'un extrait cellulaire. 

La proteine de fusion fabriquee par le proc€de 

de 1' invention a tone sequence « Proteine soluble-Asp- 

Pro-proteine toxique ». Dans la pr6sente description, 

le dipeptide Asp- Pro est aussi appel£ DP suivant le 

code a une lettre des acides amines. 

Par exemple, lorsque la prot6ine toxique est 

TME1, la proteine de fusion peut avoir la sequence 
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IDn°46 de la liste de sequences annexee, qui correspond 
a la protgine de fusion GST-DP -TME1 ; la sequence 
IDn°4 8 de la liste de sequences annexee, qui correspond 
a la proteine de fusion TrX-DP-TMEl ; ou la sequence 
5 IDn°50 de la liste de sequences annex6e, qui correspond 
a la proteine de fusion M-DP-TME1 de la liste de 
sequences annexee* 

Par exemple, lorsque la proteine toxique est 
TME2, la proteine de fusion peut avoir la sequence 
10 IDn°47 de la. liste de sequences annexee, qui correspond 
a la proteine de fusion . GST-DP-TME2 ; la sequence 
IDn°49 de la liste de sequences annexee, qui correspond 
a*la proteine de fusion T rX - DP - TME 2 ; ou la sequence 
IDn°51 de la liste de sequences annexee, qui correspond 
15 k la proteine de fusion M-DP-TME2 de la liste de 
sequences annexee . 

L'^tape de clivage de cette proteine de fusion 
peut §tre real i see avantageusement au moyen d'acide 
formique qui clive la proteine de fusion au niveau du 
20 dipeptide Asp-Pro, Elle peut etre realis€e par ailleurs 
par toute technique appropriee connue de 1'homme du 
metier pour r6cup£rer une proteine d'un echantillon a 
partir d'une prot6ine de fusion. 

2 5 * Les invent eurs sont les premiers a avoir trouve 

un systeme reellement efficace pour produire et mSme de 
surproduire, notatnment dans la bacterie Escherichia, 
coli {E. coli) des peptides hydrophobes correspondant 
aux domaines membranaires des proteines El et E2 de 

3 0 l'enveloppe du virus de 1' hepatite C, dont 1 ' expression 

est letale pour le microorganisme. 
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Le champ d' applications de la presente 
invention concerne principalement la production de 
peptides hydrophobes k grande §chelle notamment pour la 
recherche f ondamentale et industrielle . En outre, la 
production de la proteine chimere constitute de la 
proteine soluble, du dipeptide Asp-Pro, et du peptide 
hydrophobe peut etre utilisee dans un but fonctionnel, 
notamment pour renseigner sur le degre 
d'oligomtrisation du domaine membranaire ou encore sur 
sa capacite d'h£t£ropolymerxsation, 

Les proteines de fusion, ou proteines chimdres, 
sont produites via leur ADN codant present par exemple 
dans des plasmides commerciaux et a la suite desquels 
est introduit en phase l'ADN codant pour la sequence 
Asp-Pro suivi de celui codant pour le peptide toxique. 
Cette application peut etre commercialisee sous la 
forme de plasmides d' expression bacteriens qui 
incluront la sequence du site Asp-Pro, en aval de celle 
des proteines solubles dej£ prtsentes ♦ Le plasmide 
correspondant sera decrit par exemple comme un outil 
facilitant la production par voie biologique de 
peptides ou proteines membranaires toxiques . 

Ainsi, la presente invention est applicable & 
tout systeme de surexpression de proteines 
recombinant es, avec ou sans fusion a une proteine 
soluble comme par exemple . la GST, ou la thior<§doxine, 
incluant une sequence Asp-Pro non naturelle inseree en 
araont d'une sequence codant pour un domaine toxique de 
la proteine, par exemple un domaine membranaire d'une 
proteine . 
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D'autres caracteristiques et avantages de la 
presente invention apparaitront encore a l'homme du 
metier a la lecture des exemples suivants donnes a 
titre illustratif et non limitatif en reference a la 
liste de sequences et aux figures annexe es . 

Breve description de la liste de sequences annexee 

Sequences IDn°l et 2 : respectivement, sequences 
peptidiques de TME1 et de TME2 . 

Sequences IDn°3 et 4 : respect ivement, sequences 
codant pour le peptide TME1 et le peptide TME2 . 
Sequences IDn°5 et 6 : respectivement, 
oligonucleotide (+) d' insertion dans pT7-7 
(0L13( + )) et oligonucleotide (-) d' insertion dans 
pT7-7 (0L14 (-) ) . 

sequences IDn°7 et. 8 : respectivement, ADN- sens 
codant de TME1 + site cla I en 3' et ADN sens 
anticodant de TME1 + site cla I en 5 ' (sequence 
complement aire de la sequence IDn°7) . 
Sequences IDn°9 et 10 : respectivement, 
oligonucleotide sens codant (OLll(+)) et 
oligonucleotide sens anticodant (OL12(-)) pour la 
synthese de TME1. 

sequence IDn°ll : oligonucleotide (+) 
d' insertion dans pGEXKT sans site dp (0L15 ( + ) ) . 
sequence IDn°12 : oligonucleotide (+) 
d' insertion dans pGEXKT avec site dp (OL17(+)) . 
sequence IDn°13 : oligonucleotide (-) 
d' insertion dans pGEXKT (OL16 (-) ) . 

sequence IDn°14 : oligonucleotide (+) 
d' insertion dans pET32a (OL18 ( + ) ) (s ' hybride au 
segment 915-932 de pGEXKT) . 
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Sequences IDn°15 et 16 : respectivement , 
oligonucleotides ( + ) (OL19 ( + ) ) et (-) (OL20(-)) 
d' insertion dans pT7-7 de 1'ADN codant pour MDP- 
TME1 . 

Sequences IDn°17 et 18 : respectivement, 
oligonucleotide ( + ) d' insertion dans pT7-7 
(OL23 (+) ) et oligonucleotide (-) d 7 insertion dans 
pT7-7 (OL24(-)) . 

Sequences IDn°i9 et 2 0 : respectivement , ADN sens 
codant pour TME2 + site de Nde I en 5 ' et Hind III 
en 3' ; et ADN sens anticodarit de TME2 + site Nde I 
en 3' et Hind III en 5' (sequence coraplementaire de 
IDn°17) • 

Sequences IDn°21 et 22 : respectivement, 
oligonucleotides. sens codant (0L2K + )) et 
anticodant (OL22(-)) pour la synthese de TME2 • 
Sequence IDn°23 : oligonucleotide (+) 
d' insertion dans pGEXKT sans site dp (OIi25(+)) . 
Sequences IDn°24 et 25 : respectivement, 
oligonucleotides ( + ) (OL27( + )) et (-) (OL26(-)) 
d' insertion dans pGEXKT avec site dp. 

Sequences IDn°26 et 27 : respectivement, 
oligonucleotides ( + ) (OL28(+)) et (-) (OL29(-)) 
d' insertion dans pT7-7 de 1' ADN codant pour MDP- 
TME2 . 

sequence IDn°28 : fin de la sequence de la 
proteine soluble GST suivie du site thrombine codee 
dans le plasmide pGEXKT. 

Sequence IDn°29 : ADN codant pour la proteine 
GST dans le plasmide pGEXKT. 
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Sequence IDn°3 0 : ADN codant pour la 

thioredoxine (TrX) dans le plasmide pET32a+. 
Sequences IDn°31, 32 et 33 : respectivement, 
plasmides d' expression pGEXKT , pET32a+ et pT7-7. 
Sequences IDn°34 / 35 et 36 : respectivement, 
systemes d' expression selon 1' invention codant pour 
les prolines de fusion GST-DP-TME1 , . TrX-DP-TMEl et 
M-DP-TME1 . 

Sequences IDn°37, 38 et 39 : respectivement, 
systemes d' expression selon 1' invention codant pour 
les prolines de fusion GST-DP-TME2, TrX-DP-TME2 et 
M-DP-TME2. 

Sequences IDn°40 et 41 : respectivement, vecteurs 
d' expression pGEXKT- dp -pt tmei . et pGEXKT - dp -pt tme2 
selon 1' invention codant pour les proteines de 
fusion GST-DP-TME1 et GST-DP-TME2 . 

Sequences IDn°42 et 43 : respectivement, vecteurs 
d' expression pET3 2 a- dp -ptTMEi et pET3 2a- dp -pt TME2 
selon 1' invention codant pour les proteines de 
fusion TrX- DP -TMEI et TrX-DP-TME2 (codent par le 
brin complementaire) . 

Sequences IDn°44 et 45 : respectivement, vecteurs 
d' expression pT7-7-dp-ptTMEi et pT7- 7 -dp -pt TM E2 selon 
1' invention codant pour les proteines de fusion M- 
DP-TME1 et M-DP-TME2 . 

Sequences IDn°46 et 47 : respectivement, proteines 
de fusion GST -DP -TMEI et GST-DP-TME2 selon 
1' invention obtenues & partir des plasmides pGEXKT - 
dp -ptTMEi et pGEXKT- dp -ptTME2. 

Sequences IDn°48 et 49 : respectivement, proteines 
de fusion TrX-DP-TMEl et TrX-DP-TME2 selon 
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1' invention obtenues a partir des plasmides pET32a- 
dp-ptTMEi et pET32a« dp-p tTME2* 

Sequences IDn°5 0 et 51 : respect ivement, proteines 
de fusion M-DP-TME1 et M-DP-TME2 selon 1' invention 
obtenues a partir des plasmides pT7 -7- dp -pt™Ei et 
pT7 - 7 - dp -pt T MB2 - 

- Sequences IDn°52 et 53 : respec t ivement , proteines 
GST et TrX codees par le vecteur pGEXKT et pET32a+. 

Breve description des figures 

- * Figure 1 : representation schematique d'une partie 
de la polypropteine du VHC et sequence peptidique des 
domaines membranaires C-terminaux des proteines 
d'enveloppe El et E2 . Les sequences peptidiques 
representees correspondent au type infectieux #D00831 
et #M67463 pour TME1 et TME2 respect ivement obtenus de 
la. banque publique de sequences Du Laboratoire Europ^en de 
Biologie MolSculaire (« European Molecular Biology- 
Laboratory ») (EMBL) . 

Figure 2 : creation de 1'ADN codant pour le domaine 
merabranaire C-terminal de la prot£ine d'enveloppe El du 
VHC et sequences additionnelles en 5' et 3' pour 
clonage dans diff brents plasmides . Les sequences 
representees sur cette figure sont reportSes dans la 
liste de sequences annexe e . 

Figure 3 : creation de l'ADN codant pour le domaine 
membranaire C- terminal de la proteine d'enveloppe E2 du 
VHC et sequences additionnelles en 5' et 3' pour 
clonage daris differents plasmides, Les sequences 
representees sur cette figure sont reportees dans la 
liste de sequences annexee. 
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Figure 4, panneaux A a F : toxicity des domaines 
membranaires exprimes dans la bacterie et suppression 
de cette toxicite par insertion d'un site dp. Les 
panneaux A, C et E sont des representations graphiques 
de mesures de la densite optique (DO) & 600 nm en 
fonction du temps . (t) en heures de la production de 
diffSrentes proteines dans une bacterie utilisant ou 
non le systeme d' expression de la presente invention. 
Les panneaux B, D et F sont des representations des 
gels de migration des proteines respectivem£nt m des 
panneaux A, C et E . 

Figures 5 A et B : surexpression des proteines 
chimdres thioredoxine-Asp-Pro-Pt (Pt = . domaines 
membranaires des proteines) dans la bacterie. Da figure 
5A est une representation graphique de mesures de la 
densite optique (DO) a 600 nm en fonction du ' temps en 
heures de la production de differentes proteines dans 
une bacterie utilisant ou non le systeme . d' expression 
de la presente invention. La figure 5B est une 
representation d'un gel de migration des proteines de 
la figure 5A. 

Figure 6 : expression et purification de la 
proteine de fusion (ou chimere) GST-TME2, et 
comparaison avec la GST seule. Cette figure represente 
en haut les sequences peptidiques de GST et GST-TME2, 
et en bas les gels obtenus par eiectrophorese montrant 
que contrairement a GST seule, GST-TME2 est insoluble. 
Cette derniere est produite sous forme de corps 
d' inclusion qui ne peuvent pas se replier correctement . 

Figures 7A et 7B : representations graphiques de 
resultats experimentaux comparatifs montrant l'effet du 
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dipeptide DP (sequence oligonucleotidique dp-pt 
conforme & la present e invention) et du dipeptide DP et 
de la proteine soluble (sequence oligonucleotidique ps- 
dp-pt conforme a la pr^sente invention) sur la synthese 
5 des prolines toxiques TME1 et de TME2 conf ormement & 
la presente invention. 

.* EXEMPLES 

10 Dans ces exemple, les oligonucleotides utilises 

ont et;e commandes aux Laboratoires EUROBIO 
(http://www.eurobio.fr/); les plasmides ont et£ 
prepares, avec le kit QlAprep (marque de commerce) de 
QIAGEN (http://www.qiagen.com/); les sequences d'ADN 
15 ont ete sequencees avec le kit ABI PRISM (marque 
d^posSe) BigDye (marque de commerce) Terminator cycle 
d' Applied Biosystems 
(http://home.appliedbiosystems.com/) ; les souches d'E. 
colx BL21 (DE3) et BL21 (DE3) pLysS ont 6t£ obtenues chez 
20 Stratagene (http://www.stratagene.com/); les souches 
C41 et C43 (BL21 (DE3) ) ont et6 fournies par le Dr. 
Bruno Miroux (CNRS-CEREMOD, Centre de recherches sur 
1 1 endocrinologie molSculaire et le dSveloppement ; les 
enzymes de restriction et modification d 1 ADN ont 6te 
25 obtenues chez New England Biolabs 

(http://www.neb.com/neb/); les electrophoreses de 
proteines ont ete realisees avec un miniprotean 3 
(marque de commerce) des Laboratoires Bio-Rad 
(http://www.bio-rad.com); le plasmide pCR (marque 
3 0 deposee) T7 topo TA a £te obtenu chez Invitrogen 
(http://www.invitrogen.com/); le plasmide pET32a+ a 6te 
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obtemi chez Novagen (http://www.novagen.com); les 
plasmides pT7-7 et pGPl-2 et . la souche K38 [22] ont ete 
demandSs au Prof. Tabor (Department of Biological 
Chemistry/ Harvard Medical School) ; le plasmide 
5 pGEX-KT a ete demand^ au Prof . Dixon (Department of 
Biological Chemistry, University of Michigan Medical 
School) ; les autres prodiiits ont et6 obtenus chez 
Sigma (http://sigma.aldrich.com). 

Dans les exemples suivants, la production des 
10 peptides TMEl et TME2 .a et€ dans, un premier temps . 
r#alis6e sans le systdme d' expression de la presente 
invention, puis en fusion avec une protSine soluble , et 
enfin en fusion avec la GST avec insertion du site Asp- 
Pro (« DP o» en codage a une lettre) entre la protgine 
15 soluble et TMEl ou TME2 . 

L'abrSviation « SEQ IDn° » est utilis^e pour 
« sequence IDn° » et renvoie 3. la liste de sequences 
annexee . 

2 0 Exemple 1 : Synthese du systeme d f expression 

1.1) CONSTRUCTION DES VECTEURS D f EXPRESSION pT7-7-ptTMEi 

ET pT7-7-ptTME2 

L'ADN codant pour les deux domaines a 6tS 
synthetise de novo a partir des oligonucleotides 
25 appropries. Les codons ont et£ choisis suivant leur 
plus grande frequence d' utilisation dans la bacterie, 
telle qu'elle a ete quantifiee par Sharp et col. [17] . 
Les constructions sont decrites sur la figure 2 annexee 
pour TMEl et sur la figure 3 annexee pour TME2 . 

3 0 Chaque ADN synthetique a ete genere en 

utilisant un jeu de deux oligonucleotides longs et 
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chevauchants, 0L11 (SEQ IDn°9) et OL12 (SEQ n°10) pour 
TME1 et OL21 (SEQ IDn°19) et OL22 (SEQ IDn°20) pour 
TME2 , qui ont ete amplifies aprds hybridation avec deux 
oligonucleotides externes choisis en fonction du 
clonage dans un plasmide donnS. Ainsi les clonages dans 
pT7-7 ont ete realises en utilisant le jeu 
d' oligonucleotides externes OL13 (SEQ IDn°5) et OL14 
(SEQ IDn°6) pour TME1 et OIi23 (SEQ IDn°15) et OL24 (SEQ 

IDn°16) pour TME2 . . * 

* - * ~ 

Chaque ADN synthetique a ete genere en ^ 

utilisant un ieu de quatre oligonucleotides : deux 

longs et chevauchants et deux courts et externes. Les # 

ADN ont 6te amplifies par la methode de reaction de 

polymerisation en chalne {« polymerase chain 

reaction ») dite de "PCR" [18] puis clones dans un 

plasmide bacterien pCR (marque de commerce) T7 topo TA. 

Les ADN synthetisSs ont ete s£quenc€s puis sous-clones 

dans le vecteur d' expression bacterien pT7-7 [19] en 

utilisant les sites de restriction Nde I en 5' et Cla I 

ou Hind III en 3' . 

Sur la figure 2 : 

A : Sequence peptidique TME1 du sous-type #D00831. La 

numSrotation correspond a la position de la sequence 

dans la polyprot^ine comme decrit sur la figure 1. 

B : Sequence d 1 ADN codant pour le domaine membranaire 

avec des codons optimises pour 1' expression dans la 

bacterie. 

C et D : Strategie d' amplification sans matrice de 
1 1 ADN ♦ Le sens codant et le sens anticodant des 
oligonucleotides sont indiques respect ivemerit par les 
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signes ( + ) et (-) . Les oligonucleotides longs sont 
chevauchants d'une vingtaine de bases pour creer 
1 'amorce puis la matrice. Les oligonucleotides courts 
permettent d 1 amplifier la matrice par PCR en integrant 
5 les sites de restriction desires et suivant les 
plasmides utilises. L 1 insertion dans pT7-7 a et6 
realisee avec le couple d 'oligonucleotides 0L13 (SEQ 
IDn°5) et OL14 (SEQ IDn°6) , via un sous-clonage dans 
pCRT7 topo, en integrant les sites JSTde I et Hind III. 
10 L f insertion dans pGEXKT a et6 effectuee suivant la meme 
methode avec le couple d 1 oligonucleotides 0L15 {SEQ 
IDn°ll) et . OL16 (SEQ IDn°13) en integrant les sites 
BamH I et EcoR I. L T insertion du site dp (gacccg) et le 
clonage dans pGEXKT ont ete effectues avec le couple 
15 d f oligonucleotides OL17 (SEQ IDn°12) et 0L16 (SEQ 
IDn°13) . La construction dans pGEXKT a ete transferee 
dans pET32a qui code pour la thioredoxine avec le 
couple d 1 oligonucleotides OL1 8 (SEQ IDn°14) et OL16 
(SEQ IDn°13) . L 1 oligonucleotide OL18 (SEQ IDn°14) 
20 s'hybride dans la region terminale de I'ADN codant pour 
la GST dans pGEXKT. La sequence amplifiee integre la 
fin de la GST (SDLSGGGGG) suivie du site thrombine 
(LVPRGS) (SEQ IDn°28), du site DP et du passage 
merabranaire . AprSs clonage, l'ADN insere dans pET32a 
25 permet d'exprimer la chimdre thioredoxine- 
SDLSGGGGGLVPRGS-DP-TME1 (SEQ IDn°48) . 

Sur la figure 3 : 

La legende est identique a .la figure 2, mais La 
30* sequence peptidique est celle du sous-type #M67463 . 
L 1 insertion dans pT7-7 a ete realisee avec le couple 



B 14143 EE 



24 

d 1 oligonucleotides OL23 et 0L24 (respectivement SEQ 
IDn°17 et SEQ IDn°18) via un sous-clonage dans pCRT7 
topo en integrant les sites Nde I et Hind III. 

L 1 insertion dans pGEXKT a ete effectu^e suivant 
5 la merae methode avec le couple d' oligonucleotides 0L25 
et OL26 (respectivement SEQ IDn°23 et SEQ IDn°25) 
integrant les sites BamH I et EcoR I. L 1 insertion du 
site dp (gacccg) et le clonage dans pGEXKT ont ete 
effectues avec le couple d 1 oligonucleotides 0L27 et 
10 OL26 (respectivement SEQ IDn°24 et SEQ IDn°25) . 
Li 1 insertion dans pET32a a §te effectuee comme decrit 
sur la " figure 2 en utilisant . le couple 
d 1 oligonucleotides OL18 et OL26 (respectivement SEQ 
IDn°14 et SEQ IDn°25) . 

15 

1.2) CONSTRUCTION PES VECTEURS D' EXPRESSION 

pQEXKT-ptTMEi, pGEXKT -pt TM E2f pGEXKT- dp-ptrmi ET 

pGEXKT - dp " p t tme2 

Les vecteurs d' expression pGEXKT -p t xmei et 

2 0 pGEXKT -ptTME2 ont etS construits par PCR comme decrits 

sur les figures 2 et 3 annexees . L ' ADN-matr ice utilise 
pour amplifier les ADN codant pour TME1 ou TME2 est 
celui clone dans les plasmides pT7-7. Le clonage dans 
le plasmide pGEXKT [20 , 21] de TME1 a 6t€ realise en 
25 utilisant les jeux d' oligonucleotides OL15 (SEQ IDn°ll) 
et OL16 (SEQ IDn°13) permettant 1' insertion des sites 
de restriction BamH I en 5' et EcoR I en 3'. Le clonage 
de TME2 dans le m§me vecteur a ete realise en utilisant 
les jeux d' oligonucleotides' 0L25 (SEQ IDn°21) et OL26 

3 0 (SEQ IDn°23) . 



B 14143 EE 



25 



Comme indique dans la figure 2, 1 ' insertion du 
site dp en position N-terminale de TME1 a ete realisee 
en remplagant 1' oligonucleotide 5' OL15 (SEQ IDn<>ll) 
par 1' oligonucleotide 0L17 (SEQ IDn°12) . L' insertion du 
site dp en position N-terminale de TME2 a ete realisee 
en remplacant 1' oligonucleotide 5' OL25 {SEQ IDn°21) 
par 1' oligonucleotide OL27 (SEQ IDn°22) , comme montre 
dans la figure 3. 

* 

1.3) 'CONSTRUCTION PES VECTEURS D ' EXPRESS ION 

pET32a-dp-TMEl ET pET32a-dp-TME2 

lies vecteurs d' expression pET32a-dp-TMEl et 
pET32a-dp-TME2 ont 6t6 construits par PCR comme dScrits 
siir les figures 2 et 3 annexees, en utilisant le jeu. 
d' oligonucleotides indique. L' oligonucleotide amont 
integre un site EcoR V et s'hybride avec la region 
terminale de gene codant pour la GST . II permet 
d'integrer la queue de 5 glycines et le site de clivage 
par la throrabine presents dans le plasmide. 
L' oligonucleotide en aval est le meme que celui utilise 
pour le clonage dans pGEXKT . 

L' insertion dans le plasmide pET32a se fait par 
les sites MsC 1/EcdR V en 5' et EcoR I en 3 ' . 11 permet 
d'inserer en phase a la fin de la sequence de la 
thioredoxine la queue de 5 glycines, le site de clivage 
par la thrombine, le site DP et le passage membranaire. 
Le plasmide d' origine pET32a, qui sert de temoin, code 
pour la thioredoxine suivie d'une sequence integrant 
divers elements qui n'ont pas ete supprimes et qui 
contribuent pour une bonne part a la masse de la 
prot^ine chimere fabriquee. 
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L' ADN-matrice utilise pour amplifier les ADN 
codant pour TME1 ou TME2 est celui clone dans les 
plasmides pGEXKT - dp - p txMEi ou pGEXKT - dp -p fc»rME2 • Pour TME1, 
le clonage dans pET32a+ a ete realise en utilisant les 
jeux d' oligonucleotides 0L18 (SEQ IDn°14) et 0L16 
(SEQ IDn°13) . Le clonage de TME2 dans le meme vecteur a 
et€ realist en utilisant les jeux d 7 oligonucleotides 
OL18 (SEQ IDr\°14) et OL26 (SEQ IDn°23) , corame indique 
dans la figure 3 • 

Exemple 2 : Expression de sequences codant pour les 
proteines TME1 et TME2 seyjLes 

L' expression des sequences codant pour les 
domaines seuls TME1 et TME2 a ete testee par induction 
thermique ou chimique et en utilisant diff^rentes 
souches bactSriennes comme decrit ci-aprds. 

2.1) SYSTEME D ' INDUCTION THERMIQUE 

Le systeme developp£ par Tabor [22] permet 
d'exprimer une proteine par induction thermique en 
utilisant deux vecteurs dans une meme bact€rie, pT7-7 
et pGPl-2. 

Le plasmide pT7-7 contient 1'ADN a exprimer, 
place sous controle d' un promoteur <J)10 reconnu par 
l'ARN polymerase du phage T7 . Le plasmide pGPl-2 
contient le gSne codant pour la polymerase du phage T7, 
placS sous le contr6le d'un promoteur Ap L . Ce promoteur 
est r^prime par un represseur thermosensible, CI857, 
present lui aussi dans pGPl-2. A 30°C, cI857 est 
normalement exprime et r^prime le promoteur A,pi,/ ce qui 
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bloque 1 ' expression de la polymerase et done aussi 
celle de la prot6ine d'interet. 

L' induction est declench.ee par un passage de la 
culture de 37 a 42°C pendant 15-30 min, . puis 
1' expression se poursuit a 37 °C- Ce systeme est done 
particulierement bien adapte lorsqu'il est necessaire 
de controler strictement 1' expression d'une proteine 
donnee, notamment si celle- ci est toxique pour la 
bacterie. 

o - 

2.2) SYSTEME D ' INtjUCTION CHIMIQUE 

Le meme plasmide pT7-7 contenant l'ADN a 
exprimer est cette fois introduit dans des bac^Sries E. 
coli de type BL21(DE3) (B F~ dem omtP hsds(r^m^) gal X 
(DE3) et BL21 (DE3)pLysS (B F~ dem ompT hsdS(r~m~) gal % 
(DE3) [pLysS Cam 1 ]) . Ces bacteries ont Ste modifi§es 
pour contenir dans le genome une copie du g£ne codant 
pour l'ARN polymerase du phage T7, place sous contr&le 
d'un promoteur lacUV5 inductible par 1 ' isopropyle-1- 
thio-P-D-galactoside (IPTG) . Dans ce cas, les bacteries 
sont. cultiv<§es & leur temperature optimum de 37°C ou 
moins si n§cessaire. L' expression est induite par 
addition d' IPTG dans la culture. La souche 
BL21 (DE3) pLysS est particulierement bien adaptSe aux 
proteines dont 1' expression basale est toxique pour la 
bacterie h6te . En effet, la presence du plasmide pLysS 
permet 1' egression continue et a un faible niveau de 
lysozyme du phage T7 . Celui-ci inhibe la polymerase du 
phage T7, dont la faible expression en absence 
d' induction pourrait permettre 1' expression basale de 
proteine toxique. 



B 14143 EE 



# • 

28 

Les inventeurs ont aussi teste 1' expression des 
domaines metnbranaires seuls dans des souches appel^es 
C41 et C43 [10] qui ont etS selectionnees pour resister 
a 1' expression de protSines membranaires toxiques . Ces 
souches sont dSrivees de la souche BL21(DE3) et sont 
utilisees de la mSme fa<?on que cette derniere. 

2.3) TESTS D' EXPRESSION 

Suivant le syst£n\e • teste, les piasmides 
cofrespondants ont §te introduits par transformation' 
dans les differentes souches d'E. colx : K38 (HfrC X) 
pour le systeme d' induction thermique de Tabor ou les 
differentes souches BL21 pour 1' induction chimique. Le 
tableau 1 suiyant resume les tests effectues* 



Tableau 1 



Induction 


Souche 


Plasmide 


Thermique 


K38 


pT7-7 + pGP1-2 


Chimique 


BL21(DE3) 


pT7-7 


Chimique 


BL21(DE3)pLysS 


pT7-7 


Chimique 


C41 (BL21(DE3)) 


pT7-7 


Chimique 


C43 (BL21(DE3)) 


pT7-7 



Dans chaque cas, une dizaine de transf ormants 
ont ete mis. en culture pour tester 1' expression. 
Brievement, les bacteries ont ete mises en culture dans 
5 ml de LB (10 g tryptone, 5 g extrait de levure # 5 g 
NaCl, qsp 1 litre H 2 0) complements avec 50 \ig/val 
d' ampicilline (necessaire pour maintenir pT7-7 dans la 
bacterie) et 60 ug/ml de kanamycine (necessaire pour 
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maintenir pGPl-2 dans la bacterie) puis cultivees 
jusqu'a saturation soit a 30°C pour K38, soit a 37°C 
pour BL21(DE3). Les cultures' sont ensuite dilutes au 
1/10 dans le meme milieu de culture et cultivees 
jusqu'a une densite optique (DO) de 1 mesuree a 600 nm 
sur un spectrophotometre Philips PU8740 (marque de 
commerce) , 

L' expression est ensuite induite soit 
thermiquement (K38) & 42°C pendant 15 rain,^ soit 
chiraiquement (BL21(DE3)) par addition de 1 mM d'IPTG. 
Elle est poursuivie pendant 3-5 heures a 37 °C. La DOeoonm 
des cultures est mesuree a different s temps. 

A la fin de 1' expression, un volume de culture 
contenant 1 Equivalent de 0,1 DO "de bact^ries I est 
prglev€. Les bact^ries sont recoltees par 
centrifugation et suspendues dans 50 ial de solution de 
lyse (SL : Tris-Cl 50 mM, pH 8,0, EDTA 2,5 mM, SDSC 2%, 
ur£e 4 M, P-mercaptoethanol 0 ,7 M) . AprSs queiques 
minutes & temperature arabiante, 10 \xl sont deposes sur 
gel de polyacryl amide 16,5% pour 61ectrophor§se de type 
"Tricine" [23] qui permet de bien separer les proteines 
de petite masse molSculaire. 

Sur la figure 4 : 

Panneaux A, C et E : Les bacteries ont ete transformees 
avec les plasmides pT7-7, pT7-7-TMEl, pT7-7-TME2 
(panneau A) / pGEXKT, pGEXKT-TMEl, pGEXKT - TME 2 (panneau 
C) et pGEXKT - dp - TME 1 , pGEXKT- dp -TME2 (panneau E) puis 
mises en culture et induites corame d^crit ci-dessus. La 
croissance bact^rienne a ete suivie en mesurant 
1 'augmentation de turbidite de chaque culture par 
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mesure de la densite optique a 600 nm en fonction du 
temps en heures • 

Panneaux B, D, F : Lies bacteries ont ete prelevees au 
temps indique dans le texte et traitees corame d§crit 
5 ci-dessus. Elles ont ensuite ete deposees sur gel 
d l electrophor&se, soit 16 f 5% d'acrylamide de type 
"Tricine" (panneau B) , soit 14% d^crylamide de type 
Laemmli SDS-PAGE (panneaux D et P) . ^ L 1 Slectrophordse 
montr6e dans le pa'nneaii F a migre plus? longtemps que 
10 celle montree dans le panneau D, ceci pour am^liorer la 
separation des bandes dans la zone des 30000 Da. AprSs 
migration, les gels ont 6t6 colorSs 10 minutes par du 

o 

bleu~de Coomassie dans une solution de 40% methanol, 
10% d'acide acetique, 0,1% bleu de Coomassie R250, puis 
15 decolores dans une solution 10% methanol, 10% acide 
acetique, 1% glycerol. 

Que.lque soit le systeme teste, la premiSre 
observation est que la frequence de transformation des 
20 bacteries a Ste faible. Pour les bacteries qui ont pu 
§tre select ionn€es, le resultat des tests d' expression 
a ete syst£matiquement n^gatif* Un exemple est donne 
sur la figure 4, panneaux A et B, avec les series 
BL21(DE3)pLysS {[pT7-7], [pT7-7-TMEl] ou [pT7-7-TME2]}. 

25 Corame l'illustre la comparaison des courbes de 
croissance du panneaux A de la figure 4, les inventeurs 
ont constate avec les clones transformes avec 
pT7-7-TMEl ou pT7-7-TME2 et rSsistants sur milieu 
solide, que 1' induction stoppe quasi -imm€di at ement la 

3 0 croissance bacterienne, contrairement * aux clones 
contenant le plasmide seul . De meme, comme c' est 
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visible sur la figure 4 (B) , aucune bande de proteines 
migrant dans la region correspondant §l la masse 
moleculaire des produits d' expression (~ 3-4000 Da) ou 
d'oligomeres de ceux-ci ({1, 2, 3, ...}) x . masse 
5 moleculaire) n'est en effet observable. 

L' explication la plus probable a cette 
.situation est que 1' expression des domaines t 
membranaires est tres toxique pour la* bact^rie. La 
dif f icultS * d'obterfir des transf ormants laisse suppos^er 
10 qu'une expression basale, mSme trSs faible, suffit a 
les tuer. Ceci montre aussi que le systeme pLysS n'est 
pas parfait pour preveriir* cette expression basale. 
Parmi les. bactSries qui resistent k l'Stape de 
. transformation, 1' induction de I' expression des 
15 domaines hydrophobes devient immediatement letale. Les 
systSmes utilises permettent ef f ectivement de proteger 
la bact^rie h6te d'une expression basale, mais des que 
celle-ci est induite, la . toxicite est immediate et les 
bact6ries sont tuees. 

20 

Example 3 : Expression de sequences codant pour les 
proteines de fusion GST-TMEl et GST-TME2 

Les vecteurs d' expression ont Ste construits 
comme deer it dans 1'exemple 1, puis introduits dans les 
25 bactSries BL21 (DE3 ) pLysS . Les bacteries BL21 (DE3) pLysS 
ont et6 utilisees par soucis de comparaison avec les 
experiences prec^dentes car 1' expression de la GST ou 
de ses chimeres ne necessite pas le systeme DE3-pLysS. 

L' induction de l'expression a etS effectuee 
3 0 avec de I'IPTG comme pour celle des domaines seuls. Les 
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caracteristiques des proteines produites sont resum£es 
dans le tableau 2 suivant. 



Tableau 2 



Piasmide 


Chimere, 
abreviation 


Construction 


Taille, 
aa 


Masse, 
Da 


pGEXKT 


GST, G 


1M-D239 


239 


27469 


pGEXKT-T1 


GST-TME1 , 
"GT1 


1 M-S233-347M-A3B3 


269 


30506 


pGEXKT-T2 

I * 


GST-TME2, . 
| GT2 


1 M-S233-717E-A746 


263 


30191 



Les acides amines (aa) sont indiques avec le 
code & une lettre. La numerotation des sequences est 
effectu^e par rapport aux proteines d'origine, GST et 
polyprot^ine virale. Celle qui fait reference aux 
domaines membranaires est indiquee en italiques. 

Les panneaux C et D de la figure 4 annexee 
tnontrent les resultats obtenus. Les courbes de 
croissance des bacteries transformees avec les 
differents plasmides montrent que 1' expression des 
chiraSres GT1 et GT2 est toxique. Comrae on peut le voir 
sur le gel d' electrophordse de type Laemmli SDS-PAGE 
14% [24] , 1' expression de TME1 fusionn§ a la GST 
s'accompagne de 1' absence de bande migrant a la taille 
attendue de 30 kDa- Ceci laisse supposer qu'un tres 
faible niveau d' expression de la chimere est suffisant 
pour tuer les bacteries. Par contre, la chimSre GST- 
TME2 est cette fois visible sur le gel 
d' #lectrophorSse, dans la zone de masse molSculaire 
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attendue de 30 kDa. Le niveau d' expression reste 
toutef ois limite 

La proteine produite n'est pas soluble malgre 
la presence de la GST dans la fusion. En effet, comme 
le montre la figure 6 annexee, les essais de 
solubilisation, replieraent et purification de la 
chimSre GST-TME2 ont ete un Schec . 

Pour obtenir les resultats representes sur cette 
figure 6, les prot6ines GST et GST-TME2 ont ete 
exprira^es comme decrit ' sur la figure 1 4 & partir de 150 
ml de milieu de culture, Les bacteries ont ensuite ete 
recolt^es par centrif ugation et suspehdues KP0 4 2 0 mM 
pH 7.7, NaCl 0.1M, EDTA l niM, NaN 3 1 mM) pour avoir 100* 
DO/ml. Deux ml de chaque culture sont pr^leves pour 
sonication par pulses de 30 sec a 15% d' amplitude. 
Aprfes sonication, Un prel^vement est effectue pour 
electrophorese. II correspond au puits « To » sur la 
figure 6 (correspondant au « total ») • 

Une premidre centrif ugation a basse vitesse 
(5000xg, 15 minutes) permet de s^parer les bactSries 
non cass§es et les corps d' inclusion des prot^ines 
solubles ou membranaires . Ces dernidres se retrouvent 
dans le surnageant et un prelevement est effectue . II 
correspond au puits « Sum » sur la figure 6* 

La fraction contenant la GST seule est ensuite 
traitee avec une resine d'af finite qui permet de fixer 
puis d'eluer specif iquement cette proteine (puits 
« Af » du gel GST sur la figure 6) . 

La fraction contenant la proteine non soluble 
GST-TME2 est traitee soit avec un detergent doux comme 
le triton X100 (TX100) , en presence ou en absence de 
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NaCl, soit avec un detergent plus solubilisant mais 
plus destructurant corarae le sarkosyl, avant d' §tre a 
nouveau diluee dans du TX100 et pas see sur re sine 
d' af finite . 

Les resultats de la figure 6 raontrent que la GST 
est presente dans la fraction soluble, & la difference 
de la fusion GST-TME2, ce qui indique que cette 
derniere est insoluble. Le surnageant contenant la GST 
est passS sur une resine d' agarose-GSH capable die fixer 
la GST. Celle-ci est ensuite eluee avec un excSs de GSH 
(puits indiqu6 « Af » du gel GST ^ur la figure 6) . 

Le culot contenant la fusion GST-TME2 n'est pas 
solubilise en presence d'un detergent doux comme le 
TX100 (avec ou sans NaCl ajout£, puits « TX100 +/- 
NaCl » du gel GST-TME2) mais il peut §tre solubilis€ 
avec un detergent plus agressif comme le sarkosyl . 
Cependant, apres dilution de la proteine ainsi 
solubilis€e dans du TX100, un detergent doux qui . doit 
favoriser son repliement, la proteine n'est pas retenue 
sur la resine d'af finite, contrairement a la GST, ce 
qui suggere que la proteine de fusion ne peut etre 
repli§e. 

Ces tests indiquent de fagon claire que la 
proteine GST-TME2 est produite sous forme de corps 
d' inclusion que 1'on ne peut pas replier correctement . 

Exemple 4 : Expression de vecteurs d' expression codant 
pour les proteines de fusion incluant un site Asp-Pro 
et un site GST 

La construction des vecteurs a £t§ r§alisSe 
comme decrit plus haut et pour les deux vecteurs codant 



B 14143 EE 



• 



35 

pour les proteines chimeres GST-TME1 et GST-TME2, pour 
dormer naissance aux vecteurs codant pour les proteines 
chimeres GST-Asp-Pro-TMEl et GST-Asp-Pro-TME2 . Elles 
sont rlsumees dans le. tableau 3 ci-dessous. 



Tableau 3 



Plasmide 


Chimere ; 
Abreviation fig. 4 


. Construction 


Taille, 
aa 


Masse, 
Da 


pGEXKT- 
dp-TV 


GST-DP-TMEi ; . 
Gd?T1 


lM-S 2 33 dp-347M- 


271 


30718 


pGEXKT- 
&P-T2 


GST-DP-ril4E2 ; 
GxspT2 


lM-S233-dp-777E- 
A.746 * 


265 


30403 



Les acides amines (aa) sont indiques avec le 
code a une lettre. La numerotation des sequences est 
effectuee par rapport aux proteines d'origine, GST et 
polyproteine virale. Celle qui fait reference aux 
domaines membranaires est indiquee en italiques. 

Les vecteurs ont ete testes comme decrit dans 
le paragraphe precedent. Les resultats obtenus sont 
illustres sur les panneaux E et F de la figure 4 
annexee . 

Les courbes de croissance des bacteries 
transformees avec les differents plasmides montrent que 
1' expression des chimeres G dp Tl et G dp T2 est nettement 
moins toxique que dans les cas precedents. Le panneau F 
montre que cette fois, TME1 est produite du fait de la 
presence du site de clivage DP. Son niveau 
d' expression, tel qu'on peut le voir dans le panneau F, 
est relativement moyen mais signif icatif . GST-DP-TME2 
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est netteraent surproduit. Les deux proteines migrent 
dans leur zone de masse moleculaire attendue. 

L'effet de 1' addition du dipeptide DP est aussi 
significatif qu' inattendu : il atnplifie 1 ' expression . 
des domaines et supprime leur toxicite* Cet effet 
d' attenuation de la toxicite n'est pas connu pour le 
dipeptide DP, dont la seule propriety rapportee a ce 
jour est sa capacity a Stre coupe par l'acide f ormique . 
L'effet etant observe sur deux peptides differents et 
tous deux initialement toxiques pour la bact^rie, on 
peut done raisonnablement peAser. que cette propriety 
peut s'etendre. §. d'autres peptides hydrophobes et 
toxiques . 

Les inventeurs ont verifi£ que le site peut 
etre ef f ectivemient clive par l'acide fo'rmique : la 
coupure est lente et demande environ 7 jours & 
temperature atnbiante • 

Les essais d' expression k basse temperature 
(2 0°C) pendant toute une nuit de ces chim^res ont 
permis de mettre en evidence qu'elles sont produites 
sous forme native. En effet/ il est possible de 
d£ teeter une activity GST transferase dans la fraction 
merabranaire des bact6ries . De plus, cette activite est 
me sure e en solution lorsque les membranes sont 
solubilisees en presence d'un detergent non ibnique 
comme le J3-D dodecylmaltoside, aprds centrif ugation* 
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Eacemple 5 s Eacpression de vecteurs d' expression codant 
pour les proteines de fusion incluant un site Asp-Pro 
et un site codant pour la thioredoxine (TrX) 

Les vecteurs d' expression pET32a-TrX, 

p ET32a-TrX-dp-TMEl et pET32a-TrX-dp-TME2 ont etS 
construits corame decrit ci-dessus et ont 6te ensuite 
introduits dans les bact§ries BL21 (DE3) pLysS . Les 
bact<§ries BL21 (DE3) pLysS ont 6te utilises par soucis 
de cbmparaison avec les experiences pr£c€dentes car 
1' expression de la GST ou de ses chimeres ne necessite 
pas le syst^me DE3-pLysS. Les clones positifs bnt ete 
mis en culture et induits comme decrit ci-dessus. 

L' induction de 1' expression a et6 effectuSe 
avec de I'IPTG comme pour celle des domaines seuls. Les 
caracteristiques des proteines produites sont rlsumees 
dans le tableau 4 suivant* 



Tableau 4* 



Plasmide 


Chimere ; 
Abreviation fig. 4 


Construction 


Taille, 
aa 


Masse, 
Da 


pET32a 


Thioredoxine ; TrX 


lM-Ci89 


189 


20397 


pET32a- 
Gend-dp-T1 


TrX-DP-TME1 ; 
TopT1 


1M-S115-PK- 

Gend-c//>-Ti 


171 


17796 


pET32a- 
Gend-cCp-T2 


TrX-DP-TME2 ; 
T DP T2 


1M-S115-PK- 
Gend-c/p-T2 


165 


17481 



* : Tl = TME1 et T2 = TME2 



Les acides amines (aa) sont indiques avec le 
code a une lettre. La numerotation des sequences est 
effectuee par rapport aux proteines d'origine, GST et 
polyproteine virale. Celle qui fait reference aux 
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domaines merabranaires est indiquee en italiques. 
« Gend » fait reference a la sequence Oterminale de la 
GST provenant des constructions avec le plasttiide 
pGEXKT Elle correspond a la sequence peptidique 
primaire SDLSGGGGGLVPRGS . Les chimdres thioredoxine- 
SDLSGGGGGLVPRGS-DP- (TME1 ou TME2) sont plus courtes que 
la prot£ine codee dans le vecteur d'origine car 
1' insertion est effectuee immediatement apres la 
thioredoxine . 

Sur la figure 5 . : . ' 

A : la croissance bactSrienne a 6te suivie en mesurant 
1' augmentation de turbidite de chaque culture par 
density optique 600 nm en fonction du temps, 
B : les bacteries ont ete prelev€es comme indique pour 
la figure 4. Elles ont ensuite et6 deposges sur gel 
d'electrophorSse 14% d'acrylamide de type Laemmli 
SDS-PAGE et traitees comme indique pour la figure 4. 

Comme attendu, et comme le montrent les courbes 
de croissance representees sur la figure 5A annexSe des 
bacteries transform^es avec les diff brents plasmides, 
1' expression des chimdres TrX-DP-TMEl et TrX-DP-TME2 
suivant la presente invention n'est pas toxique. Le gel 
d'electrophordse repr^sente sur la figure 5B annexe de 
type Laemmli SDS-PAGE 14% [24] montre que chaque 
chimdre est surproduite . 

La presente invention permet done de fabriquer 
par recombinaison genetique des peptides hydrophobes 
correspondant aux domaines membranaires des proteines 
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El et E2 de 1'enveloppe du virus de 1' hepatite C, dont 
1' expression a ete reconnue comme letale dans les 
techniques de l'art anterieur* En outre, 1' effet gtant 
observg sur deux peptides vraiment diff^rents et tous 
deux initialement toxiques pour la bacterie, indique 
que la presente invention concerne d' autres peptides 
hydrophobes et toxiques. 

Exemple 5 s Effet du dipeptide DP sur la toxicite de^s 
domaines transmembranaires TME1 et TME2 exprimes sans 
prpteine de fusion dans la bacterie 

Cet exeiaple permet d' evaluer 1' effet antitoxique 
du dipeptide DP insert en absence de prot^ine de fusion 
GST ou TrX cpnf ormement a la revendication 1 annexee . 

A) Materiels : Les plasmides pT7-7-pfc T MEi et pT7- 
7-pt TME2 sont ceux qui sont decrits dans l'exemple 1. 
Les plasmides pT7~7-dp-ptTMEi et pT7-7-dp-ptTME2 ont et§ 
construits et clones dans pT7-7 (SEQ IDn°33) comme 
decrits dans l'exemple 1 mais en utilisant les sites 
Nde I (5') et EcoR I (3') du plasmide. Les 
oligonucleotides amont (5') int^grent la sequence dp 
(gacccg) apres la lere methionine (atg) . Les matrices 
utilisSes pour generer chaque ADN ont et6 les plasmides 
pT7-7-ptTMEi et pT7-7-ptrME2. Les sequences ont ete 
verifiees apres clonage. 

Les oligonucleotides utilises sont les 

suivants : 

i) Clonage de la sequence codant pour (M)DP- 
TME1 dans pT7-7 : 
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OL19 ( + ) : 5'- CGCATATGGACCCGATCGCTGGTGCT -3' 
{Nde I souligne) = (SEQ IDn°15 de la liste de sequences 
annexee) ; 

OL20 (-) : 5 ' - GAATTCCT AAGCGTCAACACCAGC-3 ' (EcoR 
I souligne) = (SEQ IDn°16 de la liste de sequences 
annexee). . 

ii) Clonage de la sequence codant pour (M)DP- 

TME2 dans pT7-7: t » 

0L28 ( + ) : 5'- C GCATATGG ACCCGGAATACGTTGTTC- 3 
(Nde I souligne) - (SEQ IDn°26 de la liste de sequences 
annexSe) ; 

0L2 9 (-) : 5 ' -CAGAATTCCTAAGCTTCAGCCTGAGAG-3 ' 
(EcoR I soulign6) « (SEQ IDn°27 de la liste de 
sequences annexee) . 

Les vecteurs d f expressions pT7- 7 -dp-pt^i et 
pT7 -7- dp -ptTME2 obtenus sont pr£sent£s sur la liste de 
sequences annexee (SEQ IDn°44 et SEQ IDn°45) \ 

B) L6gende des Figures 7A et B annexees : la 
souche bacterienne BL21 (DE3) pLysS a et€ transform^ 
soit avec le plasmide seul soit avec les differentes 
versions, de pT7-7 integrant les 4 constructions 
exprimant TME1, M-DP-TME1 (figure 7A) ou TME2, M-DP- 
TME2 (figure 7B) . M repr^sente la methionine, elle est 
presente en position N-terminale des peptides lorsque 
les proteines toxiques sont fabriqu^es suivant la 
presente invention avec le plasmide pT7-7. 

La croissance des diff^rents clones a etS 
comparee apres induction par l'IPTG, suivant le 
protocole identique a 1' induction chimique decrite dans 
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l'exemple 2, et moyennee sur les valeurs de DO de 4 
clones differents pour chaque construction, 

C) Resultats : 

Les figures 7A et 7B montrent que les 
bacteries ayant un plasmide exprimant des proteines 
TME1 et TME2 croissent moins vite apres induction que 
la souche temoin qui est transform^e avec le vecteur 
pT7-7 seul . 

Ces rSsultats montrent * que les souche s . 
transf ormees avec les plasmides exprimant les versions t 
M-DP-TME1 (SEQ IDn°50) et M-DP-TME2 (SEQ IDn°51) selon 
1' invention croissent signif icativement mieux ..que 
celles qui expriment les TM sans DP. Ceci est vrai pour 
TME1 et encore plus nettement pour TME2 

La conclusion est que 1' insertion. N-terminale 
de DP conforra^ment a la presente invention contribue de 
maniere surprenante a une diminution significative de 
la toxicity de 1' expression des domaines membranaires , 
notamment en absence d'une prot^ine de fusion soluble 
comme la GST ou la thior€doxine . 
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REVINDICATIONS 

1. Systeme d' expression characterise en ce 
qu'il coraprend successivement , dans le sens 5 '-3', tine 
sequence nucleotidique codant pour le dipeptide Asp-Pro 
et une sequence nucleotidique codant pour une proteine 
toxique . 

2. Systeme d' expression selon la revendication 
1, dans lequel la proteine toxique est uhe proteine 
membranaire ou un domaine d'une proteine membranaire. 

3. Systeme d' expression selon la revendication 
1, dans lequel la proteine toxique est une proteine 
membranaire ou un domaine d'une proteine membranaire 
d'une enveloppe de virus. 

4; Systeme d' expression selon la revendication 
3, dans lequel le virus est choisi parmi le virus de 
0 1' hepatite C, le virus du sida, un virus pathogene pour 
l'homme, un virus pathogene pour un mammifere. 

5. Systeme d' expression selon la revendication 
1, dans lequel la proteine toxique est une proteine 

25 transmembranaire ou un domaine d'une proteine 
transmembranaire du virus de 1' hepatite C. 

6. Systeme d' expression selon la revendication 
1, dans lequel la proteine toxique est une proteine de 

30 sequence IDn°l ou IDn°2 de la liste de sequences 
annexee . 
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7. Systeme d' expression selon la revendication 
1, dans lequel la sequence nucleotidique codant pour la 
proteine toxique est. choisie parmi la sequence IDn°3 et 
la sequence IDn°4 de la liste de sequences annexe e . 

8. Systeme d' expression selon la revendication 
7, dans lequel la sequence nucleotidique codant pour le 
dipeptide Asp-Pro est gacccg. 

9. Systeme d' expression selon la revendication 
1, comprenant en outre, en amont de la sequence Asp- 
Pro, une sequence nucleotidique codant pour une 
proteine soluble* 

10. Systeme d # expression selon la revendication 
9, dans lequel la proteine soluble est la glutathion S- 
transf erase ou la thior6doxine . 

11. Systeme d' expression selon la revendication 
1, codant pour une proteine de fusion ayant une 
sequence choisie dans le groupe const itu6 des sequences 
IDn°46, IDn°47, IDn°48 / IDn°49 , . IDn°50 et IDn°51 de la 
liste de sequences annexSe . 

12. Systeme d' expression selon la revendication 
9, ledit systeme ayant une sequence' choisie dans le 
groupe constitue des sequences IDn°34, IDn°35, IDn°36 / 
IDn°37, IDn°38 / et IDn°39 de la liste de sequences 
annexee.. 
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13. Vecteur d' expression bactSrien comprenant 
un systeme d' expression selon 1'une quelconque des 
revendi cat ions 1 a 12 clone dans un plasmide. 

14. Vecteur. d r expression bacterien comportant 
un systeme d' expression selon 1'une quelconque des 
revendications 1 4 10 et la sequence oligonucleotidique 
du plasmide pT7-7. 

15. Vecteur d' expression bacterien coiistituS de 
la sequence IDn°44 ou IDn°45 de la liste de sequences 
annexe e . 

16. Vecteur d' expression bact6rien comportant 
un systeme d' expression selon l'une quelconque des 
revendications 1 a 8 et la sequence oligonucleotidique 
d'un plasmide choisi parmi pGEXKT, pET32a. 

17. Vecteur d' expression bacterien selon la 
revendication 16 const itu£ d'une sequence choisie dans 
le groupe constitue des sequences IDn°40, IDn°41, 
IDn°42 et IDn°43 de la liste de sequences annexSes. 

18. Cellule procaryote transformee par un 
vecteur d' expression selon l'une quelconque" des 
revendications 13 a 17. 

19. Cellule procaryote E. coli selon la 
revendication 18. 
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20, Procedg de fabrication d'une proteine 
toxique par recombinaison genet ique comprenant les 
etapes suivantes : 

transformer une cellule hote avec un 
systeme d' expression selon la revendication 1 ou avec 
un vecteur d' expression selon la revendication 13, 

cultiver la cellule hote transformee dans 
des conditions de culture telles qu'elle fabrique une 
protSine de fusion comprenant le dipeptide Asp-Pro 
suivi de la sequence peptidique de la proteine toxique 
a partir dudit vecteur d' expression, et 

isoler ladite prot6ine de fusion. 

21. Proced6 selon la revendication 20 , 
comprenant en outre -une €tape consistant a cliver 
ladite proteine de fusion pour recuperer la - proteine 
toxique . 

22. Proced6 selon la revendication 20, dans 
lequel 1'etape consistant & cliver ladite proteine de 
fusion pour recuperer la proteine toxique est realisSe 
en faisant agir de 1'acide formique sur la proteine de 
fusion. 

23. Proced6 selon la revendication 20, dans 
lequel la cellule hote est E. coli. 

24. Procede selon la revendication 20, dans 
lequel le systdme d' expression code pour une proteine 
de fusion ayant une sequence choisie dans le groupe 
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20. Procede de fabrication d'une proteine 
toxique par recombinaison genetique comprenant les 
etapes suivantes : 

transformer une cellule note avec un 
systeme d' expression selon la revendication 1 ou avec 
un vecteur d' expression selon la revendication 13, 

cultiver la cellule h6te transformee dans 
des conditions de culture telles qu'elle fabrique une 
proteine de fusion comprenant le dipeptide JVsp-Pro 
suivi de la sequence peptidique de la proteine toxique 
a partir dudit vecteur d' expression, et 

. - isoler ladite proteine de fusion. 

21. Procede selon la revendication 20, 
comprenant en outre une etape consistant a cliver 
ladite proteine de fusion pour r6cuperer la proteine 
toxique . 

22. Procede selon la revendication 21, dans 
lequel 1' etape consistant a cliver ladite proteine de 
fusion pour recuperer la proteine toxique est rea.lisee 
en faisant agir de l'acide formique sur la proteine de 
fusion. 

23. Procede selon la revendication 20, dans 
lequel la cellule note est E. coli. 



24. Procede selon la revendication 20, dans 
lequel le systeme d' expression code pour une proteine 
de fusion ayant une sequence choisie dans le groupe 
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constitue des sequences IDn°46, IDn°47, IDn°48, IDn°49, 
IDn°5 0 et IDn°51 de la liste de sequences annex<§e. 

25 Procede selon la revendication 20 , dans 
lequel i e systeme d' expression a une sequence choisie 
dans le groupe constitue des sequences IDn°34, IDn°35, 
IDn°36 / IDn°37, IDn°38, et IDn°39 de la liste de 
sequences annexee , * 

26, Procede selon la revendication 20 , dans 
lequel le vecteur d' expression est constitu£ d'une 
sequence choisie dans le groupe constitue des sequences 
IDn°4 0, IDn°41, IDn°42, IDn°43, IDn°44 et IDn°45 de la 
liste de sequences annexee s . 

27 . Prot6ine de fusion ayant une sequence 
peptidique choisie dans le groupe constitue des 
sequences IDn°46, IDn°47 IDn°48, IDn°49, IDn°50 et 
IDn°51 de la liste de sequences annexee. 
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LISTE DE SEQUENCES 

<110> CENTRE NATIONAL DE IiA RECHERCHE SCIENTIFIQUE 

<120> SYSTEMES D 1 EXPRESSION DE PROTEINES TOXIQUES, VECTEURS 
ET PROCEDE DE FABRICATION DE PROTEINES TOXIQUES 

<130> B14143 EE 

<140> 
<141> 

<160> 53 

<170> Patentln Ver. 2.1 
<210> 1 

<211> 37 v 
<212> PRT 

<213> Hepatitis C virus 
<400> 1 

Met lie Ala Gly Ala His Trp Gly Val Leu Ala Gly lie Ala Tyr Phe 
1 5 10 15 

Ser Met Val Gly Asn Trp Ala Lys Val Leu Val Val Leu Leu Leu Phe 
20 25 30 

Ala Gly Val Asp Ala 
35 



<:210> 2 
<211> 31 
<212> PRT 

<213> Hepatitis C virus 
<400> 2 

Met Glu Tyr Val Val Leu Leu Piie Leu Leu Leu Ala Asp Ala Arg Val 
15 10 15 

Cys Ser Cys Leu Trp Met Met Leu Leu lie Ser Gin Ala Glu Ala 
20 25 30 



<210> 3 
<211> 111 
<212> ADN 

<213> Hepatitis C virus 
<400> 3 

atgatcgctg gtgctcactg gggtgttctg gctggtatcg cttacttctc tatggttggt 60 
aactgggcta aagttctggt tgttctgctg ctgttcgctg gtgttgacgc t 111 



<210> 4 
<211> 93 
<212> ADN 

<213> Hepatitis C virus 
<400> 4 
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atggaatacg ttgttctgct gttcctgctg ctggctgacg ctcgtgttfcg ctcttgcctg 60 
tggatgatgc tgctgatctc tcaggctgaa get ~ 93 



<210> 5 
<211> 24 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: 

oligonucleotide .( + ) d' insertion dans pT7-7 

<400> 5 

gggaatgeca tatgatcget ggtg 24 

<210> 6 
<211> 23 
<2X2> ADN 

<213> Sequence artificielle . 
» 

<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d ! insertion dans pT7-7 

<400> 6 

gcatatcgat etaagegtea aca 23 



<210> 7 
<211> 131 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide de ♦ „ . . (A COMPLETER ) 

<400> 7 

atgccatatg atcgctggtg ctcactgggg tgttctggct ggtatcgett acttctctat 60 
ggttggtaac tgggctaaag ttctggttgt tetgetgetg ttcgctggtg ttgaegctta 120 
gatcgatatg c 131 



<210> 8 
<211> 131 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide de (A COMPLETER ) 

<400> 8 

gcatatcgat etaagegtea acaccagcga acagcagcag aacaaccaga actttagccc 60 

agttaccaac catagagaag taagegatae cagccagaac accccagtga gcaccagcga 120 

tcatatggca t " *" ~ 131 



<210> 9 
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<211> 74 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide ( + ) de . „ (A 

COMPLETER ) 

<400> 9 

atgccatatg atcgctggtg ctcactgggg tgttctggct ggtatcgctt acttctctat 60 
ggttggtaac tggg 74 

<210> 10 

<211> 79 . . 

* <212> ADN * . ^ 

<213> Sequence artificielle . 

<220> 

<223> Description de la sequence artificielle: 
oligonucleotide (-) de ^ 

. {A COMPLETER) 

<400> 10 % . 

gcatatcgat ctaagcgtca acaccagcga acagcagcag aacaaccaga actttagccc 60 
agttaccaac catagagaa 79 



<210> 11 
<211> .22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d 1 insertion dans pGEXKT sans 
site dp 

<400> 11 

ggatccatgg aatacgttgt tc 22 



<210> 12 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide ( + ) d 1 insertion dans pGEXKT avec 
site dp 

<400> 12 

ggatccgacc cgatggaata cgttgttc 



<210> 13 
<211> 23 
<212> ADN 
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<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle; 

oligonucleotide (-) d» insertion dans pGEXKT 

<400> 13 

gaattcctaa gcttcagcct gag 



<210> 14 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide {+) de transfert dans pET32a 

<400> 14. * % 

gtgatatctg atctgtctgg tggtggt 



<210> 15 
<211> 26 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d 1 insertion dans pT7~7 

<400> 15 

cgcatatgga cccgatcgct ggtgct 



<210> 16 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d' insertion dans pT7-7 

<400> 16 

gaattcctaa gcgtcaacac cage 

<210> 17 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d'insertioon dans pT7-7 

<400> 17 

catatggaat acgttgttc 
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<210> 18 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la s§quence artificielle: 

oligonucleotide (-) d'insertioon dans pT7-7 

<400> 18 

aagcttaagc ttcagcctga gagatcag 



<210> 19 
<211> 103 
<212> ADN 

<213> Sequence .artificielle 
<220> - 

<223> Description de la sequence artificielle: ADN sens 
codant pour TME2 + site Nde I en 5 1 et Hind III en 

3 1 « ■ - 

<400> 19 . 
catatggaat acgttg^tct gctgttcctg ctgctggctg acgctcgtgt ttgctcttgc 
ctgtggatga tgctgctgat ctctcaggct gaagcttaag ctt 



<210> 20 

<211> 103 

<212> ADN c 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: ADN sens 
anticodant de TME2 + site Nde I en 3 1 et Hind III 
en 5' 

<400> 20 

aagcttaagc ttcagcctga gagatcagca gcatcatcca caggcaagag caaacacgag 
cgtcagccag cagcaggaac agcagaacaa cgtattccat atg 



<210> 21 
<211> 68 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide sens codant ( + ) pour la synthase 
de TME2 

<400> 21 

catatggaat acgttgttct gctgttcctg ctgctggctg acgctcgtgt ttgctcttgc 60 
ctgtggat 68 



<210> 22 
<211> 57 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide sens codant (-) pour la synthase 
de TME2 

<400> 22 

aagcttaagc ttcagcctga gagatcagca gcatcatcca caggcaagac gaaacac 



<210> 23 
<211> 19 
<212> ADN 

« f i.3> Sequence artificielle 

*3> Description de la sequence artificielle: 

oligonucleotide (+) d» insertion dans pGEXKT sans 
site dp 

*400> 23 

ggatccgaat acgttgttc 



<210> 24 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d 1 insertion dans pGEXKT avec 
site dp 

<400> 24 

ggatccgacc cggaatacgt tgttc 



<210> 25 
<211> 30 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d' insertion dans pGEXKT avec 
site dp 

<400> 25 

gaattcttaa gcttcagcct gagagatcag 



<210> 26 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
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oligonucleotide (+> d 1 insertion dans pT7-7 



<400> 26 

cgcatatgga cccggaatac gttgttc 



27 



<210> 27 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d 1 insertion dans pT7-7 

<400> 27 

cagaattcct aagcttcagc ctgagag 27 



<210> 28 
<211> 15 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: fin de la 
GST suivie du site thrombins 

<400> 28 

Ser Asp Leu Ser Gly Gly Gly Gly Gly Leu Val Pro Arg Gly Ser 
15 10 15 



<210> 29 
<211> 717 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: ADN 

codant pour la proteine GST dans le vecteur pGEXKT 

<400> 29 

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60 
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120 
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180 
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240 
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300 
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360 
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420 
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 48 0 
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540 
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600 
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660 
ctgtctggtg gtggtggtgg tctggttccg cgtggatccc cgggaattca tcgtgac 717 



<210> 30 
<211> 327 
<212> ADN 

<213> Sequence artificielle 
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<220> 

<223> Description de la slquence artificielle: ADN 
codant pour la thioredoxine dans le vecteur 
pET32a+ 

<400> 30 

atgagcgata aaattattca cctgactgac gacagttttg acacggatgt actcaaagcg 60 
gacggggcga tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgcc 120 
ccgattctgg atgaaatcgc tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180 
atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gactctgctg 240 
ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 3 00 
aaagagttcc tcgacgctaa cctggcc 327 



<210> 31 
<211> 4969 
<212> ADN 

<213> Sequence artificielle 
<220> * 

<223> Description de la sequence artificielle: plasmide 
d r expression pGEXKT 

<400> 31 

acgttatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg 60 
gtatggctgt gcaggtcgta . aatcactgca taattcgtgt cgctcaaggc gcactcccgt 120 
tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc 180 
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca 240 
cacaggaaac agtattcatg tcccctatac taggttattg gaaaattaag ggccttgtgc 300 
aacccactcg acttcttttg gaatatcttg aagaaaaata tgaagagcat ttgtatgagc 360 
gcgatgaagg tgataaatgg. cgaaacaaaa agtttgaatt gggtttggag tttcccaatc 420 
ttccttatta tattgatggt gatgttaaat taacacagtc tatggccatc atacgttata 480 
tagctgacaa gcacaacatg ttgggtggtt gtccaaaaga gcgtgcagag atttcaatgc 540 
ttgaaggagc ggttttggat attagatacg gtgtttcgag aattgcatat agtaaagact 600 
ttgaaactct caaagttgat tttcttagca agctacctga aatgctgaaa atgttcgaag 660 
atcgtttatg tcataaaaca tatttaaatg gtgatcatgt aacccatcct gacttcatgt 720 
tgtatgacgc tcttgatgtt gttttataca tggacccaat gtgcctggat gcgttcccaa 780 
aattagtttg ttttaaaaaa cgtattgaag ctatcccaca aattgataag tacttgaaat 840 
ccagcaagta tatagcatgg cctttgcagg gctggcaagc cacgtttggt ggtggcgacc 900 
atcctccaaa atcggatctg tctggtggtg gtggtggtct ggttccgcgt ggatccccgg 960 
gaattcatcg tgactgactg acgatctgcc tcgcgcgttt cggtgatgac ggtgaaaacc 1020 
tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 1080 
gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggcgca gccatgaccc 1140 
agtcacgtag cgatagcgga gtgtataatt cttgaagacg aaagggcctc gtgatacgcc 1200 
tatttttata ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc 1260 
ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 1320 
cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 1380 
gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 1440 
ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 1500 
tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 1560 
aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgtg 1620 
ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 1680 
agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 1740 
gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 1800 
gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 1860 
gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 1920 
cagcaafcggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 1980 
ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 2040 
cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 2100 
gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 2160 
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cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 2220 
tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 2280 ■ 
aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 2340 
aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 2400 
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 2460 
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 2520 
ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 2580 
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 2640 
tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 2700 
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 2760 
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 2820 
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 28 80 
cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 294 0 
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 3000 
ccagcaacgc ggccttttta cggttcctgg. ccttttgctg gccttttgct cacatgttct 3060 
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 3120 
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 3180 
gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc ataaattccg 3240 
acaccatcga atggtgcaaa acctttcgcg gtatggcatg atagcgcccg gaagagagtc 3300 
aattcagggt ggtgaatgtg aaaccagtaa cgttatacga tgtcgcagag tatgccggtg 3360 
tctcttatca gaccgtttcc cgcgtggtga accaggccag ccacgtttct gcgaaaacgc 3420 
gggaaaaagt ggaagcggcg atggcggagc tgaattacat tcccaaccgc gtggcacaac 3480 
aactggcggg caaacagtcg ttgctgattg gcgttgccac ctccagtctg gc<?ctgcacg 3540 
cgccgtcgca aattgtc^cg gcgattaaat ctcgcgccga tcaactgggt gccagcgtgg 3600 
tggtgtcgat ggtagaacga agcggcgtcg aagcctgtaa agcggcggtg cacaatcttc 3660 
tcgcgcaacg cgtcagtggg ctgatcatta actatccgct ggatgaccag gatgccattg 3720 
ctgtggaagc tgcctgcact aatgttccgg cgttatttct tgatgtctct gaccagacac 3780 
ccatcaacag tattattttc tcccatgaag acggtacgcg actgggcgtg gagcatctgg 3840 
tcgcattggg tcaccagcaa atcgcgctgt tagcgggccc attaagttct gtctcggcgc 3900 
gtctgcgtct ggctggctgg cataaatatc tcactcgcaa tcaaattcag ccgatagcgg 3960 
aacgggaagg cgactggagt gccatgtccg gttttcaaca aaccatgcaa atgctgaatg 4020 
agggcatcgt tcccactgcg atgctggttg ccaacgatca gatggcgctg ggcgcaatgc 4080 
gcgccattac cgagtccggg ctgcgcgfctg gtgcggatat ctcggtagtg ggatacgacg 4140 
ataccgaaga cagctcatgt tatatcccgc cgttaaccac catcaaacag gattttcgcc 4200 
tgctggggca aaccagcgtg gaccgcttgc tgcaactctc tcagggccag gcggtgaagg 4260 
gcaatcagct gttgcccgtc tcactggtga aaagaaaaac cacdctggcg cccaatacgc 4320 
aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 4380 
gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 4440 
ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa 45 0 0 
caatttcaca caggaaacag ctatgaccat gattacggat tcactggccg tcgttttaca 4560 
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 462 0 
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 4680 
cagcctgaat ggcgaatggc gctttgcctg gtttccggca ccagaagcgg tgccggaaag 4740 
ctggctggag tgcgatcttc ctgaggccga tactgtcgtc gtcccctcaa actggcagat 48 00 
gcacggttac gatgcgccca tctacaccaa cgtaacctat cccattacgg tcaatccgcc 4860 
gtttgtfcccc acggagaatc cgacgggttg ttactcgctc acatttaatg ttgatgaaag 4920 
ctggctacag gaaggccaga cgcgaattat ttttgatggc gttggaatt 4969 



<210> 32 
<211> 11800 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: plasmide 
d 1 expression pET32a+ 

<400> 32 

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 
ggggttatgc tagttattgc tcagcggtgg cagcagccaa taggcctata tcaaggagga 120 
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aagtcgtttt ttggggagtt ctgggcaaat 
agtcgccacc gtcgtcggtt ctcagcttcc 
tggtggtggt ggtggtgctc gagtgcggcc 
gagtcgaagg aaagcccgaa acaatcgtcg 
ctcacgccgg cgttcgaaca gctgcctcga 
tgtcgtcgtc gtcggtaccc agatctgggc 
cagcggtttc tttcatacca aggctatagt 
tctagacccg acaggtacac gaccgcaagc 
gaaccgcgtg gcaccagacc agaagaatga 
gaaccggcca ggttagcgtc gaggaactct 
tcttcttact actactacta ccacgtatac 
ctccttgaga aagttgactg ctttagacag 
gtttttgaac agcagcagag tcgggatacc 
gaaatctgtc acgtgggfcga aaccaacggc 
agccctatgg tgcctacggt ataaagccgc 
ttgcaacggt cagtttgcdc tgatattcgt 
ttttgcacgg accgcaccac caaaactagc 
actataagca gtcgctaaag taggtcttag 
tctgcccaga aatcgacgag gatcgccccg 
tcgtcagtca ggtgaataat tttatcgctc 
ctagcggggc aggcgaaact catgtaggca 
aaatagcgag^ fcatacat^ata ctccttctta 
ttgttatccg" ctcacaattc ccctatagtg 
gaggaagaat ttcaatttgt tttaataaag 
gggatatcac tcagcataat taaagcgccc 
acgcatcgtg gccggcatca ccggcgccac 
catcaccgat ggggaagatc tagagctagg 
ggccgcggtg tccacgccaa cgaccgcgga 
gggctcgcca cttcgggctc atgagcgctt 
tggccggggg actgttgggc gccatctcct 
tactcgcgaa caaagccgca cccataccac 
cggtagagga acgtacgfcgg attccttgcg 
ctgggctgct tcctaatgca ggagtcgcat 
taaggaacgc cgccgccacg agttgccgga 
cctcagcgta ttccctctcg cagctctagg 
gcggtatggc atgatagcgc ccggaagaga 
taacgttata cgatgtcgca gctfcaccgcg 
ggccttctct cagttaagtc ccaccactta 
gagtatgccg gtgtctctta tcagaccgtt 
tctgcgaaaa cgcgggaaaa agtggaagcg 
agtctggcaa agggcgcacc acttggtccg 
tcaccttcgc cgctaccgcc agctgaatta 
gggcaaacag tcgttgctga ttggcgttgc 
tcgacttaat gtaagggttg gcgcaccgtg 
aaccgcaacg gtggaggtca gaccgggacg 
aatctcgcgc cgatcaactg ggtgccagcg 
tcgaagcctg taaagcggcg cgtttaacag 
ccacggtcgc accaccacag ctaccatctt 
gtgcacaatc ttctcgcgca acgcgtcagt 
caggatgcca ttgctgfcgga agctgcctgc 
tgcgcagtca cccgactagt aattgatagg 
tcgacggacg tgattacaag cggcgttatt 
cagtattatt ttctcccatg aagacggtac 
gccgcaataa agaactacag agactggtct 
ttctgccatg cgctgacccg cacctcgtag 
tgttagcggg cccattaagt tctgtctcgg 
atctcactcg caatcaaatt cccagtggtc 
agacagagcc gcgcagacgc agaccgaccg 
cagccgatag cggaacggga aggcgactgg 
caaatgctga atgagggcat cgttcccact 
tccgctgacc tcacggtaca ggccaaaagt 



ctccggggtt ccccaatacg atcaataacg 180 
tttcgggctt tgttagcagc cggatctcag 240 
gcaagcttgt cgacggagct cgaattcgga 300 
gcctagagtc accaccacca ccaccacgag 360 
gcttaagcct tccgatatca gccatggcct 420 
tgtccatgtg ctggcgttcg aatttagcag 480 
cggtaccgga acagcagcag cagccatggg 540 
ttaaatcgtc gtcgccaaag aaagtatggt 600 
tgatgatgat ggtgcatatg gccagaacca 660 
ttcaactgac cttggcgcac cgtggtctgg 720 
cggtcttggt cttggccggt ccaatcgcag 780 
tgcacccact ttggttgccg ccacttcacc 840 . 
acggatgcca tatttcggcg cagtgccagg 900 
ggtgaagtgg caaaaacttg tcgtcgtctc 960 
gtcacggtcc gttttgatcg atgttcagtt 1020 
cagcgatttc atccagaatc ggggcgatca 1080 
tacaagtcaa aacgttgcca gtcaaacggg 1140 
ccccgctagt aaaacgfcgcc tggcgtggtg 1200 
tccgctttga gtacatccgt gtcaaaactg 1260 
atatgtatat agacgggtct ttagctgctc 1320 
cagttttgac agcagtcagt ccacttatta 1380 
aagttaaaca aaattatttc tagaggggaa 1440 
agtpgtatta atttcgcggg atcgagatcg 150O 
atctcccctt aacaataggc gagtgttaag 1560 
tagctctagc atctcgatcc tctacgccgg 1620 
aggtgcggtt gctggcgcct atatcgccga 1680 
agatgcggcc tgcgtagcac cggccgtagt 1740 
tatagcggct gtagtggcta ccccttctag 1800 
gtttcggcgt gggtatggtg gcaggccccg I860 
tgcatgcacc cccgagcggt gaagcccgag 1920 
cgtccggggc accggccccc tgacaacccg 1980 
gcggcggtgc tcaacggcct caacctacta 2040 
aagggagagc gtcgagatcc cggacaccat 2100 
gttggatgat gacccgacga aggattacgt 2160 
gcctgtggta cgaatggcgc aaaacctttc 2220 
gtcaattcag ggtggtgaat gtgaaaccag 2280 
ttttggaaag cgccataccg tactatcgcg 2340 
cactttggtc attgcaatat gctacagcgt 2400 
tcccgcgtgg tgaaccaggc cagccacgtt 2460 
gcgatggcgg ctcatacggc cacagagaat 2520 
gtcggtgcaa agacgctttt gcgccctttt 2580 
cattcccaac cgcgtggcac aacaactggc 2640 
cacctccagt ctggccctgc acgcgccgtc 2700 
ttgttgaccg cccgtttgtc agcaacgact 2760 
tgcgcggcag gcaaattgtc gcggcgatta 2820 
tggtggtgtc gatggtagaa cgaagcggcg 2880 
cgccgctaat ttagagcgcg gctagttgac 294 0 
gcttcgccgc agcttcggac atttcgccgc 3000 
gggctgafcca ttaactatcc gctggatgac 3060 
actaatgttc cacgtgttag aagagcgcgt 3120 
cgacctactg gtcctacggt aacgacacct 3180 
tcttgatgtc tctgaccaga cacccatcaa 3240 
gcgactgggc gtggagcatc tggtcgcatt 3300 
gtgggtagtt gtcataataa aagagggtac 3360 
accagcgtaa gggtcaccag caaatcgcgc 3420 
cgcgtctgcg tctggctggc tggcataaat 3480 
gtttagcgcg acaatcgccc gggtaattca 3540 
accgtattta tagagtgagc gttagtttaa 3600 
agtgccatgt ccggttttca acaaaccatg 3660 
gcgatgctgg gtcggctate gccttgccct 3720 
tgtttggtac gtttacgact tactcccgta 3780 
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gcaagggtga cgctacgacc ttgccaacga tcagatggcg ctgggcgcaa tgcgcgccat 3840 
taccgagtcc gggctgcgcg ttggtgcgga catctcggta gtgggatacg acgataccga 3 900 
aacggttgct agtctaccgc gacccgcgtt acgcgcggta atggctcagg cccgacgcgc 3960 
aaccacgcct gtagagccat caccctatgc tpgctatggct agacagctca tgttatatcc 4020 
cgccgttaac caccatcaaa caggattttc gcctgctggg gcaaaccagc gtggaccgct 4080 
tgctgcaact ctctcagggc tctgtcgagt acaatatagg gcggcaattg gtggtagttt 4140 
gtcctaaaag cggacgaccc cgtttggtcg cacctggcga acgacgttga gagagtcccg 4200 
caggcggtga agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg 4260 
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg gtccgccact tcccgttagt 4320 
cgacaacggg cagagtgacc acttttcttt ttggtgggac cgcgggttat gcgtttggcg 4380 
gagaggggcg cgcaaccggc attcattaat gcagctggca cgacaggttt cccgactgga 4440. 
aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag gcaccgggat 4500 
taagtaatta cgtcgaccgt gctgtccaaa gggctgacct ttcgcccgtc actcgcgttg 4560 
cgttaattac attcaatcga gtgagtaatc cgtggcccta ctcgaccgat gcccttgaga 4620 
gccttcaacc ckgtcagctc cttccggtgg gcgcggggca tgactatcgt cgccgcactt 4680 
atgactgtct tctttatcat gagctggcta cgggaactct cggaagttgg gtcagtcgag 4740 
gaaggccacc cgcgccccgt actgatagca gcggcgtgaa tactgacaga agaaatagta 4800 
gcaactcgta ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg 4860 
ctggagcgcg acgatgatcg' gcctgtcgct tgcggtattc cgttgagcat cctgtccacg 4920 
gccgtcgcga gacccagtaa aagccgctcc tggcgaaagc gacctcgcgc tgctactagc 4980" 
cggacagcga acgccataag ggaatcttgc acgccctcgc tcaagccttc gtca'c€ggtc 5040 
ccgccaccaa acgtttcggc gagaagcag^ ccattatcgc cggcatggcg gccccacggg 5100 _ 
ccttagaacg tgcgggagcg agttcgrgaag cagtgaccag ggcggtggtt tgcaaagccg 5160 
ctcttcgtcc ggtaatagcg gccgtaccgc cggggtgccc tgcgcatg^t cgtgctcctg 5220 
tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg 5280 
atacgcgagc gaacgtgaag acgcgtacta gcacgaggac agcaactcct gggccgatcc 5340 
gaccgcccca acggaatgac caatcgtctt acttagtggc tatgcgctcg cttgcacttc 5400 
cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca tgaatggtct tcggtttccg 5460 
tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc gctgacgacg acgttttgca 5520 
gacgctggac tcgttgttgt acttaccaga agccaaaggc acaaagcatt tcagaccttt 5580 
gcgccttcag fccgcgggacg accattatgt tccggat.ctg catcgcagga tgctgctggc 5640 
taccctgtgg aacacctaca tctgtattaa cgaagcgctg gcattgaccc tgagtgattt 5700, 
tggtaataca aggcctagac gtagcgtcct acgacgaccg atgggacacc ttgtggatgt 5760 
agacataatt gcttcgcgac cgtaactggg actcactaaa ttctctggtc ccgccgcatc 5820 
cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta 5880 
acccgtatcg tgagcatcct aagagaccag ggcggcgtag gtatggcggt caacaaatgg 5940 
gagtgttgca aggtcattgg cccgtacaag tagtagtcat tgggcatagc actcgtagga 6000 
ctctcgtttc atcggtatca ttacccccat gaacagaaat cccccttaca cggaggcatc 6060 
agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc gagagcaaag tagccatagt 6120 
aatgggggta cttgtcttta gggggaatgt gcctccgtag tcactggttt gtcctttttt 6180 
ggcgggaatt gtaccgggcg ttfcatcagaa gccagacatt aacgcttctg gagaaactca 6240 
acgagctgga cgcggatgaa caggcagaca tctgtgaatc gcttcacgac cacgctgatg 630 0 
aaatagtctt cggtctgtaa ttgcgaagac ctctttgagt tgctcgacct gcgcctactt 6360 
gtccgtctgt agacacttag cgaagtgctg gtgcgactac agctttaccg cagctgcctc 6420 
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 6480 
gcttgtctgt aagcggatgc tcgaaatggc gtcgacggag cgcgcaaagc cactactgcc 6540 
acttttggag actgtgtacg tcgagggcct ctgccagtgt cgaacagaca ttcgcctacg 6600 
cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc 6660 
catgacccag tcacgtagcg atagcggagt gtatactggc gccctcgtct gttcgggcag 6720 
tcccgcgcag tcgcccacaa ccgcccacag ccccgcgtcg gtactgggtc agtgcatcgc 6780 
tatcgcctca catatgaccg tfcaactatgc ggcatcagag cagattgtac tgagagtgca 6840 
ccatatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 6900 
aattgatacg ccgtagtctc gtctaacatg actctcacgt ggtatatacg ccacacttta 6960 
tggcgtgtct acgcattcct cttttatggc gtagtccgcg tcttccgctt cctcgctcac 7020 
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7080 
aatacggtta tccacagaat agaaggcgaa ggagcgagtg actgagcgac gcgagccagc 7140 
aagccgacgc cgctcgccat agtcgagtga gtttccgcca ttatgccaat aggtgtctta 7200 
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 7260 
aaaaggccgc gttgctggcg tttttccata ggctccgccc gtcccctatt gcgtcctttc 7320 
ttgtacactc gttttccggt cgttttccgg tccttggcat ttttccggcg caacgaccgc 7380 
aaaaaggtat ccgaggcggg ccctgacgag catcacaaaa atcgacgctc aagtcagagg 7440 
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tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 7500 
gggactgctc gtagtgtttt tagctgcgag ttcagtctcc accgctttgg gctgtcctga 7560 
tatttctatg gtccgcaaag ggggaccttc gagggagcac cgcfcctcctg ttccgaccct 7620 
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 7680 
ctcacgctgt aggtatctca gcgagaggac aaggctggga cggcgaatgg cctatggaca 7740 
ggcggaaaga gggaagccct tcgcaccgcg aaagagtatc gagtgcgaca tccatagagt 7800 
gttcggtgta ggt'cgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7860 
accgctgcgc cttatccggt aactatcgtc ttgagtccaa caagccacat ccagcaagcg 7920 
aggttcgacc cgacacacgt gcttgggggg caagtcgggc tggcgacgcg gaataggcca 7980 
ttgatagcag aactcaggtt cccggtaaga cacgacttat cgccactggc agcagccact 8040 
;;~vaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 8100 
.i^ccattct gtgctgaata gcggtgaccg tcgtcggtga. ccattgtcct aatcgtctcg 8160 
ctccatacat ccgccacgat gtctcaagaa cttcaccacc cctaactacg gctacactag 8220 
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 8280 
tagctcttga tccggcaaac ggattgatgc cgatgtgatc .ttcctgtcat aaaccataga 8340 
u^gagacga cttcggtcaa tggaagcctt tttctcaacc atcgagaact aggccgtttg 8400 
•aaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 8460 
•-^gatctca agaagatccfc ttgatctttt ctacggggtc tttggtggcg accatcgcca 8520 
^aaaaaac aaacgttcgt cgtctaatgc gcgtcttttt ttcctagagt tcttctagga 8580 
dctagaaaa gatgccccag tgacgctcag tggaacgaaa actcacgtta agggattttg 8640 
.-atgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 8700 
i^tgcgagtc accttgcttt tgagtgcaat tccctaaaac cagtactcta atagtttttc 8760 
ctagaagtgg atctaggaaa atttaatttt tacttcaaaa aaatcaatct aaagtatata 8820 
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8880 
ctgtctattt cgttcatcca tttagttaga tttcatatat actcatttga accagactgt 8940 
caatggttac gaattagtca ctccgtggat agagtcgcta gacagataaa g.caagtaggt 9000 
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggcfcta ccatctggcc 9060 
ccagtgctgc aatgataccg cgagacccac gctcaccggc atcaacggac tgaggggcag 9120 
cacatctatt gatgctatgc cctcccgaat ggtagaccgg ggtcacgacg ttactatggc 9180 
gctchgggtg cgagtggccg tccagattta tcagcaataa accagccagc cggaagggcc 9240 
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 9300 
aggtctaaat agtcgttatt tggtcggtcg gccttcccgg ctcgcgtctt caccaggacg 9360 
ttgaaatagg cggaggtagg tcagataatt aacaacggcc gaagctagag taagtagttc 9420 
gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc 9480 
gtcgtttggt atggcttcat cttcgatctc attcatcaag cggtcaatta tcaaacgcgt 9540 
tgcaacaacg gtaacgacgt ccgtagcacc acagtgcgag cagcaaacca taccgaagta 9600 
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 9660 
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa agtcgaggcc aagggttgct 9720 
agttccgctc aatgtactag ggggtacaac acgttttttc gccaatcgag gaagccagga 9780 
ggctagcaac agtcttcatt gttggccgca gtgttatcac tcatggttat ggcagcactg 9840 
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 9900 
caaccggcgt cacaatagtg agtaccaata ccgtcgtgac gtattaagag aatgacagta 9960 
cggtaggcat tctacgaaaa gacactgacc actcatgagt accaagtcat tctgagaata 10020 
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 10080 
tagcagaact ttaaaagtgc tggttcagta agactcttat cacatacgcc gctggctcaa 10140 
cgagaacggg ccgcagttat gccctattat ggcgcggtgt atcgtcttga aattttcacg 10200 
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 10260 
ccagttcgat gtaacccact cgtgcaccca actgatcttc agtagtaacc ttttgcaaga 10320 
agccccgctt ttgagagttc ctagaatggc gacaactcta ggtcaagcta cattgggtga 10380 
gcacgtgggt tgactagaag agcatctttt actttcacca gcgtttctgg gtgagcaaaa 10440 
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 10500 
tcgtagaaaa tgaaagtggt cgcaaagacc cactcgtttt tgtccttccg ttttacggcg 10560 
ttttttccct tattcccgct gtgcctttac aacttatgag atactcttcc tttttcaata 10620 
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 10680 
gaaaaataaa caaatagggg tatgagaagg aaaaagttat aataacttcg taaatagtcc 10740 
caataacaga gtactcgcct atgtataaac ttacataaat ctttttattt gtttatcccc 10800 
ttccgcgcac atttccccga aaagtgccac ctgaaattgt aaacgttaat attttgttaa 10860 
aattcgcgtt aaatttttgt taaatcagct cattttttaa aaggcgcgtg taaaggggct 1092 0 
tttcacggtg gactttaaca tttgcaatta taaaacaatt ttaagcgcaa tttaaaaaca 10980 
atttagtcga gtaaaaaatt ccaataggcc gaaatcggca aaatccctta taaatcaaaa 11040 
gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag 11100 
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ggttatccgg ctttagccgt tttagggaat atttagtttt cttatctggc tctatcccaa 11160 
ctcacaacaa ggtcaaacct tgttctcagg tgataatttc aacgtggact ccaacgtcaa 11220 
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 11280 
ttttttgggg tcgaggtgcc ttgcacctga ggttgcagtt tcccgctttt tggcagatag 1134 0 
tcccgctacc gggtgatgca cttggtagtg ggattagttc aaaaaacccc agctccacgg 114 00 
gtaaagcact aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc 11460 
cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg catttcgtga tttagccttg 11520 
ggatttccct cgggggctaa atctcgaact gcccctttcg gccgcttgca ccgctctttc 11580 
cttcccttct ttcgctttcc agcgggcgct agggcgctgg caagtgtagc ggtcacgctg 11640 
cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca 11700 
tcgcccgcga tcccgcgacc gttcacatcg ccagtgcgac gcgcattggt ggtgtgggcg 11760 
gcgcgaatta cgcggcgatg tcccgcgcag ggtaagcggt 11800 



<210> 33 
<211> 2504 
<212> ADN 

<213> Sequence artificielle f 
<220> • 

<223> Description de La sequence artificielle: sequence 
du jplasmide pT7-7 . 

<400> 33 

aattctcatg tttgacagct tatcatcgat gataagcttg ggctgcaggt cgactctaga 60 
ggatccccgg gcgcgaattc tagccatatg tatatctcct tcttaaagtt aaacaaaatt 120 
atttctagag ggaaaccgtt gtggtctccc tatagtgagt cgtattaatt' tcgaagtcta 180 
tcagaagttc gaatcgctgg gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 240 
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 3 00 
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 360 
tagcgatagc ggagtgtata tactggctta actatgcggc atcagagcag attgtactga 420 
gagtgcacca taggaagatc tfcccggaaga tcttcctatg cggtgtgaaa taccgcacag 480 
atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcetcgctca ctgactcgct 540 
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 600 
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 660 
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 720 
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 780 
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 840 
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg 900 
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 960 
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 102 0 
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 1080 
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 1140 
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 1200 
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 1260 
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 1320 
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 1380 
ctagatcctt ttaattcttg aagacgaaag ggcctcgtga tacgcctatt tttataggtt 1440 
aatgtcatga taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc 1500 
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 1560 
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 1620 
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 1680 
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 1740 
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 1800 
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtgttga cgccgggcaa 1860 
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 1920 
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 1980 
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 2040 
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 2100 
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2160 
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2220 
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gactggatgg aggcggataa agttgcagga 
tggtttattg ctgataaatc tggagccggt 
ctggggccag atggtaagcc ctcccgtatc 
actatggatg aacgaaatag acagatcgct 
taactgtcag accaagttta ctcatatata 



ccacttctgc gctcggccct tccggctggc 2280 
gagcgtgggt ctcgcggtat cattgcagca 2340 
gtagttatct acacgacggg gagtcaggca 2400 
gagataggtg cctcactgat * taagcattgg 2460 
ctttagattg attt 2504 



<210> 34 
<211> 813 
<212> ADN 

<213> Sequence artificielle 

<220> . * 

<223> Description de la sequence artificielle: syst:eme 

d 1 expression codant pour la prote^ne de fusion 

GST-DP-TME1 

<400> 34 

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60 
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 12 ff. 
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat .180 
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240 
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300 
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt^ 36 0 
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420 
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480 
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540 
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600 
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660 
ctgtctggtg gtggtggtgg tctggttccg cgtggatccg acccgatcgc tggtgctcac 720 
tggggtgttc tggctggtat cgcttacttc tctatggttg gtaactgggc taaagttctg 780 
gttgttctgc tgctgttcgc tggtgttgac get 813 



<210> 35 
<211> 513 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: systerae 
d 1 expression codant pour la proteine de fusion 
TrX-DP-TMEl 



<400> 35 

atgagegata aaattattca cctgactgac 
gaeggggega tcctcgtcga tttctgggca 
ccgattctgg atgaaatege tgacgaatat 
atcgatcaaa accctggcac tgcgccgaaa 
ctgttcaaaa acggtgaagt ggcggcaacc 
aaagagttcc tegaegctaa cctggccggt 
tctggtggtg gtggtggtct ggttccgcgt 
ggtgttctgg ctggtatcgc ttacttctct 
gttctgctgc tgttcgctgg tgttgacgct 



gacagttttg acaeggatgt actcaaagcg 60 
gagtggtgcg gtccgtgcaa aatgatcgee 120 
cagggcaaac tgaccgttgc aaaactgaac 180 
tatggcatcc gtggtatccc gaetctgetg 240 
aaagtgggtg cactgtctaa aggtcagttg 300 
tctggttctg gatctccaaa ateggatctg 3 60 
ggatccgacc egategctgg tgctcactgg 420 
atggttggta actgggctaa agttctggtt 480 
tag 513 



<210> 36 
<211> 117 
<212> ADN 

<213> Sequence artificielle 
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<220> 

<223> Description de la sequence artif icielle : systSme 
d' expression codant pour la protg'ine de fusion 
M-DP-TMEl 



<400> 36 

atggacccga tcgctggtgc tcactggggt gttctggctg gtatcgctta cttctctatg 60 
gttggtaact gggctaaagt tctggttgtt ctgctgctgt tcgctggtgt tgacgct 117 

<210> 37 
<211> 795 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : systdme 
d 1 expression codant pour la proteine de fusion 
GST-DP-TME2 



<400> 37 \ 

atgtccccta. 

ttggaatatc 

tggcgaaaca 

ggtgatgtta 

atgttgggtg 

gatattagat 

gattttctta 

acatatttaa 

gttgttttat 

aaacgtattg 

tggcctttgc 

ctgtctggtg 

ctgttcctgc 

tctcaggctg 



tactaggtta 
ttgaagaaaa 
aaaagtttga 
aattaacaca 
gttgtccaaa 
acggtgtttc 
gcaagctacc 
atggtgatca 
acatggaccc 
aagctatccc 
agggctggca 
Qtggtggtgg 
tgctggctga 
aagct 



ttggaaaatt 
atatgaagag 
attgggtttg 
gtctatggcc 
agagcgtgca 
gagaattgca 
tgaaatgctg 
tgtaacccat 
aatgtgcctg 
acaaattgat 
agccacgttt 
tctggttccg 
cgctcgtgtt 



aagggccttg 
catttgtatg 
gagtttccca 
atcatacgtt 
gagatttcaa 
tatagtaaag 
aaaatgttcg 
cctgacttca 
gatgcgttcc 
aagtacttga 
ggtggtggcg 
cgtggatccg 
tgctcttgcc 



tgcaacccac 
agcgcgatga 
atcttcctta 
atatagctga 
tgcttgaagg 
actttgaaac 
aagatcgttt 
tgttgtatga 
caaaattagt 
aatccagcaa 
accatcctcc 
acccggaata 
tgtggatgat 



tcgacttctt 
aggtgataaa 
ttatattgat 
caagcacaac 
agcggttttg 
tctcaaagtt 
atgtcataaa 
cgctcttgat 
ttgttttaaa 
gtatatagca 
aaaatcggat 
cgttgttctg 
gctgctgatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

795 



<210> 38 
<211> 486 
<212> ADN 

<213> Sequeixce artif icielle 
<220> 

<223> Description de la sequence artif icielle: systime 
d 1 expression codant pour la proteine de fusion 
TrX - DP - TME2 

<400> 38 

atgagcgata aaattattca cctgactgac gacagttttg acacggatgt actcaaagcg 60 
gacggggcga tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgcc 120 
ccgattctgg atgaaatcgc tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180 
atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gactctgctg 240 
ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 300 
aaagagttcc tcgacgctaa cctggccggt tctggttctg gatctgatct gtctggtggt 360 
ggtggtggtc tggttccgcg tggatccgac ccggaatacg ttgttctgct gttcctgctg 420 
ctggctgacg ctcgtgtttg ctcttgcctg tggatgatgc tgctgatctc tcaggctgaa 480 
gcttag ~ - ^ 486 



<210> 39 
<211> 99 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: systeme 
d' expression codant pour la prot£ine de fusion 
M-DP-TME2 

<400> 39 

atggacccgg aatacgttgt tctgctgttc ctgctgctgg ctgacgctcg tgtttgctct 60 
tgcctgtgga tgatgctgct gatctctcag gctgaagct 99 



<210> 40 
<211> 5082 

<212> ADN * 
<213>* Sequence artificielle 

,<220> • . 

<223> Description de la sequence artificielle: vecteur 
d ! expression pGEXKT-dp-Pt (TME1) 

<400> 40 

acgttatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg 60 
gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt 120 
tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc 180 
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca 24Q 
cacaggaaac agtattcatg tcccctatac taggttattg gaaaattaag ggccttgtgc 30.0 
aacccactcg acttcttttg gaatatcttg aagaaaaata tgaagagcat ttgtatgagc 360 
gcgatgaagg tgataaatgg cgaaacaaaa agtttgaatt gggtttggag tttcccaatc 420 
ttccttatta tattgatggt gatgttaaat taacacagtc tatggccatc atacgttata 480 
tagctgacaa gcacaacatg ttgggtggtt gtccaaaaga gcgtgcagag atttcaatgc 540 
ttgaaggagc ggttttggat attagatacg gtgtttcgag aattgcatat agtaaagact 600 
ttgaaactct caaagttgat tttcttagca agctacctga aatgctgaaa atgttcgaag 660 
atcgtttatg tcataaaaca tatttaaatg gtgatcatgt aacccatcct gacttcatgt 720 
tgtatgacgc tcttgatgtt gttttataca tggacccaat gtgcctggat gcgttcccaa 780 
aattagtttg ttttaaaaaa cgtattgaag ctatcccaca aattgataag tacttgaaat 840 
ccagcaagta tatagcatgg cctttgcagg gctggcaagc cacgtttggt ggtggcgacc 900 
atcctccaaa atcggatctg tctggtggtg gtggtggtct ggttccgcgt ggatccgacc 960 
cgatcgctgg tgctcactgg ggtgttctgg ctggtatcgc ttacttctct atggttggta 1020 
actgggctaa agttctggtt gttctgctgc tgttcgctgg tgttgacgct taggaattca 1080 
tcgtgactga ctgacgatct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 1140 
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 1200 
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 1260 
tagcgatagc ggagtgtata attcttgaag acgaaagggc ctcgtgatac gcctattttt 1320 
ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa 1380 
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 1440 
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 1500 
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 1560 
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 1620 
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 1680 
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc 1740 
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 1800 
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 1860 
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 1920 
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 1980 
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgcagcaat 2040 
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 2100 
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 2160 
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 2220 
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 2280 
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tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 2340 
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 2400 
tttttaattt aaaaggatct aggtgaagat ccttttfcgat aatctcatga ccaaaatccc 2460 
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 2520 
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 2580 
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 2640 
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 2700 
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 2760 
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 2820 
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 2880 
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 2940 
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 3000 
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 3060 
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 3120 
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 3180 
gttatcccct gattctgtgg ataaccgtat ^taccgccttt gagtgagctg ataccgctcg 3240 
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgafc 3300 
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataaatt ccgacaccat 3360 
cgaatggtgc aaaacjctttc gcggtatggc atgatagcgc ^pcggaagaga gtcaattcag 3420 
ggtggtgaat gtgaaaccag taacgttata c^Stgtcgca gagtatgccg gtgtctctta 3480' 
tcagaccgtt tcccgcgtgg tgaaccaggc cagcoacgt:t tctgcgaaaa cgcgggaaaa 3540 
agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac aacaactggc 3600 
gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc acgcgccgtc 3660 
gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg tggtggtgtc 3720 
gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc ttctcgcgca 3780 
acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca ttgctgtgga 3840 
agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga cacccatcaa 3900 
cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc tggtcgcatt 3960 
gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg cgcgtctgcg 4020 
tctggctggc tggcataaat afcctcactcg caatcaaatt cagccgatag cggaacggga 4080 
aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga atgagggcat 4140 
cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa tgcgcgccat 4200 
taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg acgataccga 4260 
agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc gcctgctggg 4320 
gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga agggcaatca 4380 
gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata cgcaaaccgc 4440 
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 4500 
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 4560 
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 4620 
acacaggaaa cagctatgac catgattacg gattcactgg ccgtcgtttt acaacgtcgt 4680 
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 4740 
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 4800 
aatggcgaat ggcgctttgc ctggtttccg gcaccagaag cggtgccgga aagctggctg 4860 
gagtgcgatc ttcctgaggc cgatactgtc gtcgtcccct caaactggca gatgcacggt 4920 
tacgatgcgc ccatctacac caacgtaacc tatcccatta cggtcaatcc gccgtttgtt 4980 
cccacggaga atccgacggg ttgttactcg ctcacattta atgttgatga aagctggcta 5040 
caggaaggcc- agacgcgaat tatttttgat ggcgttggaa tt 5082 



<210> 41 
<211> 5064 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: vecteur 
d ! expression pGEXKT-dp-Pt (TME2) 

<400> 41 

acgttatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg 60 
gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt 120 
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tctggataat gtfcttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc 18 0 
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca 240 
cacaggaaac agtattcatg tcccctatac taggttattg gaaaattaag ggccttgtgc 300 
aacccactcg acttcttttg gaatatcttg aagaaaaata tgaagagcat ttgtatgagc 360 
gegatgaagg tgataaatgg cgaaacaaaa agtttgaatt gggtttggag tttcccaatc 42 0 
ttccttatta tattgatggt gatgttaaat taacacagtc tatggccatc atacgttata 480 
tagctgacaa gcacaacatg ttgggtggtt gtccaaaaga gcgtgcagag atttcaatgc 540 
ttgaaggagc ggttttggat attagatacg gtgtttcgag aattgcatat agtaaagact 600 
ttgaaactct caaagttgat tttcttagca agctacctga aatgctgaaa atgttcgaag 660 
a^'-gtttatg tcataaaaca tatttaaatg gtgatcatgt aacccatcct gacttcatgt 720 
v 4t a tgacgc tcttgatgtt gttttataca tggacccaat gtgcctggat gcgttcccaa 780 
Ae^tagtttg ttttaaaaaa cgtattgaag ctatcccaca aattgataag tacttgaaat 840 
ccagcaagta tatagcatgg cctttgcagg gctggcaagc cacgtttggt ggtggcgacc 900 
atcctccaaa atcggatctg tctggtggtg gtggtggtct ggttccgcgt ggatccgacc 960 
j-g-jaatacgt tgttchgctg ttcctgctgc tggctgacgc .tcgtgtttgc tcttgcctgt 1020 
ws*tgatgct gctgatctct caggctgaag cttaggaatt catcgtgact gactgacgat 1080 
~<-c*cctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 1140 
*a*cacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgteagc 1200 
.^^tgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 1260 
-^attcttga agacgaaagg gcctcgtgat acgcctattt ttataggtta atgtcatgat 1320 
**taatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg gaacccc tat 1380 
ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 1440 
aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct 1500 
tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa i560 
agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa 1620 
cagcggtaag atcctfcgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt 1680 
taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag agcaactcgg 1740 
tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca 1800 
tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa 1860 
cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt 1920 
gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc 1980 
cataccaaac gacgagcgtg acaccacgat gcctgcagca atggcaacaa cgttgcgcaa 2040 
actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga 2100 
ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc 2160 
tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga 2220 
tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga 2280 
acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga 2340 
ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat 2400 
ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt 2460 
ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct 2520 
gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 2580 
ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 2640 
aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 2700 
gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc 2760 
gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 2 820 
aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 2880 
cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 2940 
tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 3000 
ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 3 060 
atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 3120 
cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt 3180 
ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga 3240 
gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac 3300 
gcatctgtgc ggtatttcac accgcataaa ttccgacacc atcgaatggt gcaaaacctt 3360 
tcgcggtatg gcatgatagc gcccggaaga gagtcaattc agggtggtga atgtgaaacc 3420 
agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt 3480 
ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc 3 540 
ggagctgaat tacattccca accgcgtggc acaacaactg gcgggcaaac agtcgttgct 3600 
gattggcgtt gccacctcca gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat 3660 
taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg 3720 
cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat 3 780 
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cattaactat ccgctggatg accaggatgc 
tccggcgtta tttcttgatg tctctgacca 
tgaagacggt acgcgactgg gcgtggagca 
gctgttagcg ggcccattaa gttctgtctc 
atatctcact cgcaatcaaa ttcagccgat 
gtccggtttt caacaaacca tgcaaatgct 
ggttgccaac gatcagatgg cgctgggcgc 
cgttggtgcg gatatctcgg tagtgggata 
cccgccgtta accaccatca aacaggattt 
cttgctgcaa ctctctcagg gccaggcggt 
ggtgaaaaga aaaaccaccc tggcgcccaa 
cgattcatta atgcagctgg cacgacaggt 
acgcaattaa tgtgagttag ctcactcatt 
cggctcgtat gttgtgtgga attgtgagcg 
accatgatta* cggattcact ggccgtcgtt 
gttacccaac ttaatcgcct tgcagcacat 
9^ggcccgca cccjatcgccc ttcccaacag 
gcctggtttc cggcaccaga agcggtgccg 
gccgatactg tcgfcgtccc ctcaaactgg 
accaacgtaa cctatcccat tacggtcaat 
ggttgttact cgctcacatt taatgttgat 
attatttttg atggcgttgg aatt 
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cattgctgtg gaagctgcpt gcactaatgt 3840 
gacacccatc aacagtatta ttttctccca 3900 
tctggtcgca ttgggtcacc agcaaatcgc 3960 
ggcgcgtctg cgtctggctg gctggcataa 4020 
agcggaacgg gaaggcgact ggagtgccat 4080 
gaatgagggc atcgttccca ctgcgatgct 4140 
aatgcgcgcc attaccgagt ccgggctgcg 42 00 
cgacgatacc gaagacagct catgttatat 4260 
tcgcctgctg gggcaaacca gcgtggaccg 4320 
gaagggcaat cagctgttgc ccgtctcact 43 80 
tacgcaaacc gcctctcccc gcgcgttggc 4440 
ttcccgactg gaaagcgggc agtgagcgca 4500 
aggcacccca ggctttacac tttatgcttc 4560 
gataacaatt tcacacagga aacagctatg 4620 
£tacaacgtc gtgactggga aaaccctggc 4680 
ccccctttcg ccagctggcg taatagcgaa 4740 
ttgcgcagcc tgaatggcga atggcgcttt ^800 
gaaagctggc tggagtgcga^ tcttcctgag 4860 
cagatgcacg gttacgatgc gcccatctac 4920 
ccgccgtttg ttcccacgga gaatccgacg 4980 
gaaagctggc tacaggaagg ccagacgcga 5040 

'* 5064 



<210> 42 
<211> 5918 

<212> ADN *. * 

<213> S§quence artif icielle 

<220> 

<223>. Description de la sequence artif icielle : vecteur 
^expression pET32a-dp-Pt (TME1) 

<400> 42 

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180 
cgacggagct cgaattccta agcgtcaaca ccagcgaaca gcagcagaac aaccagaact 240 
ttagcccagt taccaaccat agagaagtaa gcgataccag ccagaacacc ccagtgagca 300 
ccagcgatcg ggtcggatcc acgcggaacc agaccaccac caccaccaga cagatccgat 3 60 
tttggagatc cagaaccaga accggccagg ttagcgtcga ggaactcttt caactgacct 420 
ttagacagtg cacccacttt ggttgccgcc acttcaccgt ttttgaacag cagcagagtc 480 
gggataccac ggatgccata tttcggcgca gtgccagggt tttgatcgat gttcagtttt 540 
gcaacggtca gtttgccctg atattcgtca gcgatttcat ccagaatcgg ggcgatcatt 600 
ttgcacggac cgcaccactc tgcccagaaa tcgacgagga tcgccccgtc cgctttgagt 660 
acatccgtgt caaaactgtc gtcagtcagg tgaataattt tatcgctcat atgtatatct 720 
ccttcttaaa gttaaacaaa attatttcta gaggggaatt gttatccgct cacaattccc 780 
ctatagtgag tcgtattaat ttcgcgggat cgagatcgat ctcgatcctc tacgccggac 840 
gcatcgtggc cggcatcacc ggcgccacag gtgcggttgc tggcgcctat atcgccgaca 900 
tcaccgatgg ggaagatcgg gctcgccact tcgggctcat gagcgcttgt ttcggcgtgg 960 
gtatggtggc aggccccgtg gccgggggac tgttgggcgc catctccttg catgcaccat 1020 
tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc ctaatgcagg 1080 
agtcgcataa gggagagcgt cgagatcccg gacaccatcg aatggcgcaa aacctttcgc 1140 
ggtatggcat gatagcgccc ggaagagagt caattcaggg tggtgaatgt gaaaccagta 1200 
acgttatacg atgtcgcaga gtatgccggt gtctcttatc agaccgtttc ccgcgtggtg 1260 
aaccaggcca gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc gatggcggag 1320 
ctgaattaca ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc gttgctgatt 1380 
ggcgttgcca cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc ggcgattaaa 1440 
tctcgcgccg atcaactggg tgccagcgtg gtggtgtcga tggtagaacg aagcggcgtc 1500 
gaagcctgta aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg gctgatcatt 1560 
aactatccgc tggatgacca ggatgccatt gctgtggaag ctgcctgcac taatgttccg 1620 
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gcgttatttc ttgatgtctc tgaccagaca cccatcaaca gtattatttt ctcccatgaa 1680 
gacggtacgc gactgggcgt ggagcatctg gtcgcattgg gtcaccagca aatcgcgctg 1740 
ttagcgggcc cattaagttc tgtctcggcg cgtctgcgtc tggctggctg gcataaatat 1800 
ctcactcgca atcaaattca gccgatagcg gaacgggaag gcgactggag tgccatgtcc 1860 - 
ggttttcaac aaaccatgca aatgctgaat gagggcatcg ttcccactgc gatgctggtt 1920 
gccaacgatc agatggcgct gggcgcaatg cgcgccatta ccgagtccgg gctgcgcgtt 1980 
ggtgcggaca tctcggtagt gggatacgac gataccgaag acagctcatg ttatatcccg 2040 
ccgttaacca ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt ggaccgcttg 2100 
ctgcaactct ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt ctcactggtg 216 0 
aaaagaaaaa ccaccctggc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 2220 
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 2280 
aattaatgta agttagctca cfccattaggc accgggatct cgaccgatgc ccttgagagc 2340 
cttcaaccca gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat 2400 
gactgtcttc tttatcatgc aacfccgtagg acaggtgccg gcagcgctct gggtcatttt 2460 
cggcgaggac cgctttcgct ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg 2520 
aatcttgcac gccctcgctc aagccttcgt cactggtccc gccaccaaac gtttcggcga 2580 
gaagcaggcc attatcgccg gcatggcggc cccacgggtg cgcatgatcg tgctcctgtc 2640 
gttgaggacc cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat 2700 
acgcgagcga acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg 2760 
aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag ' cgccctgcac 2820^ 
cattatgttc cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc 2880 
tgtattaacg aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca 2940. 
taccgccagt tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac 3000 
ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaatcc 3060 
cccttacacg gaggcatcag tgaccaaaca ggaaaaaacc gcccttaaca tggcccgctt 3120 
tatcagaagc cagacattaa cgcttctgga gaaactcaac gagctggacg cggatgaaca 3180 
ggcagacatc tgtgaatcgc ttcacgac.ca cgctgatgag ctttaccgca gctgcctcgc 3240 
gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc 3300 
ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg 3360 
cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt atactggctt 3420 
aactatgcgg catcagagca gattgtactg agagtgcacc atatatgcgg tgtgaaatac 3480 
cgcacagatg cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg 3540 
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 3600 
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 3660 
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 3720 
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 3780 
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctcfccctgtt ccgaccctgc 3840 
cgcttaccgg a'tacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 3900 
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 3960 
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4020 
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4080 
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 4140 
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 4200 
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 4260 
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtct'g 4320 
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta. tcaaaaagga 4380 
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 444 0 
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 4500 
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 456 0 
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 4620 
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 4680 
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 4740 
cagttaatag tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt 4800 
cgbttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 4860 
* ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 4920 
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 4980 
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5040 
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 5100 
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 5160 
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 5220 
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 5280 
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aaaagggaat aagggcgaca cggaaatgtt 
attgaagcat ttatcagggt tattgtctca 
aaaataaaca aataggggtt ccgcgcacat 
acgttaatat' tttgttaaaa ttcgcgttaa 
aataggccga aatcggcaaa atcccttata 
gtgttgttcc agtttggaac aagagtccac 
ggcgaaaaac cgtctatcag ggcgatggcc 
ttttggggtc gaggtgccgt aaagcactaa 
gagcttgacg gggaaagccg gcgaacgtgg 
cgggcgctag ggcgctggca agtgtagcgg 
cgcttaatgc gccgctacag ggcgcgtccc 



gaatactcat actcttcctt tttcaatatt 5340 
tgagcggata catatttgaa tgtatttaga 5400 
ttccccgaaa agtgccacct gaaattgtaa 5460 
atttttgtta aatcagctca ttttttaacc 5520 
aatcaaaaga atagaccgag atagggttga 5580 
tattaaagaa cgtggactcc aacgtcaaag 5640 
cactacgtga accatcaccc taatcaagtt 57 00 
atcggaaccc taaagggagc ccccgattta 5760 
cgagaaagga agggaagaaa gcgaaaggag 5820 
tcacgctgcg cgtaaccacc acacccgccg 5880 
attcgcca 5918 



<210> 43 

<211> 5891 
<212> ADN 

<213> Sequence art if icielle 
<220> 

<223> Description de la s€quence artif icielle : • vecteur 
d 1 expression pET32a-dp-Pt (TME2) 

<400> 43 

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 
ggggttatgc tagttattgc tcagcggtgg " cagcagccaa ctcagcttcc tttcgggctt 120 ' 
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc. gcaagcttgt 180 
cgacggagct cgaattccta agcttcagcc tgagagatca gcagcatcat ccacaggcaa 240 
gagcaaacac gagcgtcagc cagcagcagg aacagcagaa caacgtattc" cgggtcggat 300 
ccacgcggaa ccagaccacc accaccacca gacagatcag atccagaacc agaaccggcc 360 
aggttagcgt cgaggaactc tttcaactga cctttagaca gtgcacccac tttggttgcc 420 
gccacttcac cgtttttgaa cagcagcaga gtcgggatac cacggatgcc atatttcggc 480 
gcagtgccag ggttttgatc gatgttcagt tttgcaacgg tcagtttgcc ctgatattcg 540 
tcagcgattt catccagaat cggggcgatc attttgcacg gaccgcacca ctctgcccag 600 
aaatcgacga ggatcgcccc gtccgctttg agtacatccg tgtcaaaact gtcgtcagtc 660 
aggtgaataa ttttatcgct catatgtata tctccttctt aaagttaaac* aaaattattt 720 
ctagagggga attgttatcc gctcacaatt cccctatagt gagtcgtatt aatttcgcgg 780 
gatcgagatc gatctcgatc ctctacgccg gacgcatcgt ggccggcatc accggcgcca 840 
caggtgcggt tgctggcgcc tatatcgccg acatcaccga tggggaagat cgggctcgcc 900 
acttcgggct catgagcgct tgtttcggcg tgggtatggt ggcaggcccc gtggccgggg 960 
gactgttggg cgccatctcc ttgcatgcac cattccttgc ggcggcggtg ctcaacggcc 1020 
tcaacctact actgggctgc ttcctaatgc aggagtcgca taagggagag cgtcgagatc 1080 
ccggacacca tcgaatggcg caaaaccttt cgcggtatgg catgatagcg cccggaagag 1140 
agtcaattca gggtggtgaa tgtgaaacca gtaacgttat acgatgtcgc agagtatgcc 1200 
ggtgtctctt atcagaccgt ttcccgcgtg gtgaaccagg ccagccacgt ttctgcgaaa 1260 
acgcgggaaa aagtggaagc ggcgatggcg gagctgaatt acattcccaa ccgcgtggca 1320 
caacaactgg cgggcaaaca gfccgttgctg attggcgttg ccacctccag tctggccctg 1380 
cacgcgccgt cgcaaattgt cgcggcgatt aaatctcgcg ccgatcaact gggtgccagc 1440 
gtggtggtgt cgatggtaga acgaagcggc gtcgaagcct gtaaagcggc ggtgcacaat 1500 
cttctcgcgc aacgcgtcag tgggctgatc attaactatc cgctggatga ccaggatgcc 1560 
attgctgtgg aagctgcctg cactaatgtt ccggcgttat ttcttgatgt ctctgaccag 1620 
acacccatca acagtattat tttctcccat gaagacggta cgcgactggg cgtggagcat 1680 
ctggtcgcat tgggtcacca gcaaatcgcg ctgttagcgg gcccattaag ttctgtctcg 1740 
gcgcgtctgc gtctggctgg ctggcataaa tatctcactc gcaatcaaat tcagccgata 1800 
gcggaacggg aaggcgactg gagtgccatg tccggttttc aacaaaccat gcaaatgctg 1860 
aatgagggca tcgttcccac tgcgatgctg gttgccaacg atcagatggc gctgggcgca 1920 
atgcgcgcca ttaccgagtc cgggctgcgc gttggtgcgg acatctcggt agtgggatac 1980 
gacgataccg aagacagctc atgttatatc ccgccgttaa ccaccatcaa acaggatttt 2040 
cgcctgctgg ggcaaaccag cgtggaccgc ttgctgcaac tctctcaggg ccaggcggtg 2100 
aagggcaatc agctgttgcc cgtctcactg gtgaaaagaa aaaccaccct ggcgcccaat 2160 
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt 2220 
tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtaagttagc tcactcatta 2280 
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ggcaccggga tctcgaccga tgcccttgag 
ggcgcggggc atgactatcg tcgccgcact 
aggacaggtg ccggcagcgc tctgggtcat 
gacgatgatc ggcctgtcgc ttgcggtatt 
cgtcactggt cccgccacca aacgtttcgg 
ggccccacgg gtgcgcatga tcgtgctcct 
ttgccttact ggttagcaga atgaatcacc 
ctgcaaaacg tctgcgacct gagcaacaac 
aagfcctggaa acgcggaagt 
atgctgctgg ctaccctgtg 
ctgagtgatt tttctctggt 
ttccagtaac cgggcatgtt 
catcggtatc attaccccca 



agccttcaac ccagtcagct 
tatgactgtc ttctttatca 
tttcggcgag gaccgctttc 
cggaatcttg cacgccctcg 
cgagaagcag gccattatcg 
gtcgttgagg acccggctag 
gatacgcgag cgaacgtgaa 



ccttccggtg 2340 
tgcaactcgt 2400 
gctggagcgc 2460 
ctcaagccfct 2520 
ccggcatggc 2580 
gctggcgggg 2640 
gcgactgctg 2700 
gtgtttcgta 2760 
gcatcgcagg 2820 
ggcattgacc 
cctcacaacg 
tctctcgttt 
cagtgaccaa 
taacgcttct 



2880 
2940 
3000 
3060 
3120 
3180 
3240 



atgaatggtc ttcggtttcc 
cagcgccctg caccattatg ttccggatct 
gaacacctac atctgtatta acgaagcgct 
cccgccgcat ccataccgcc agttgtttac 
catcatcagt aacccgtatc gtgagcatcc 
tgaacagaaa tcccccttac acggaggcat 
acaggaaaaa accgccctta acatggcccg cfcttatcaga agccagacat 
ggagaaactc aacgagctgg acgcggatga acaggcagac .atctgtgaat cgcttcacga 
ccacgctgat gagctttacc gcagctgcct cgcgcgtttc ggtgatgacg .gtgaaaacct 
cjtgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 3300 
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca 3360 
gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga gcagattgta 3420 
ctgagagtgc accatatatg cggtgtgaaa * taccgcaqag atgcgtaagg agaaaatacc 34iB0 
gcatcag^cg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 3540 

tcaaaggcgg taatacggtt atccacagaa 
gcaaaaggcc agcaaaaggc caggaaccgt 
aggctccgcc cccctgacga gcatcacaaa 
ccgacaggac tataaagata ccaggcgttt 
gtfcccgaccc tgccgcttac cggatacctg 



ggcgagcggt atcagctcac 
acgcaggaaa gaacatgtga 
cgttgctggc gfcttttccat 
caagtcagag gtggcgaaac 
gctccctcgt gcgctctcct 



tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 
.ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 
cage age cac tggtaacagg attagcagag cgaggtatgt aggeggtget 
tgaagtggtg gcctaactac ggctacacta gaaggacacft atttggtatc 
tgaagccagt taccttegga aaaagagttg gtagctcttg ateeggcaaa 
ctggtagcgg tggttttttt gtttgeaage agcagattac gcgcagaaaa 
aagaagatcc tttgatcttt tetaeggggt ctgacgctca gtggaacgaa 
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 
gcttaatcag tgaggcacct atetcagega tctgtctatt tcgttcatcc 
gactccccgt cgtgtagata actacgatac 
caatgatacc gcgagaccca cgctcaccgg 
ceggaaggge egagegcaga agtggtcctg 
attgttgccg ggaagctaga gtaagtagtt 
ccattgctgc aggcategtg gfcgtcacgcfe 
gttcccaacg ateaaggega gttacatgat 
ccttcggtcc tecgategtt gtcagaagta 
tggcagcact gcataattct cttactgtca 
gtgagtactc aaccaagtca ttctgagaat 
eggegtcaat aegggataat accgcgccac 
gaaaacgttc tteggggega aaactctcaa 
tgtaacccac tcgtgcaccc aactgatctt 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 



tcaggggata 
aaaaaggccg 
aatcgacget 
ccccctggaa 
tccgcctttc 
agttcggtgt 
gaccgctgcg 
tcgccactgg 
acagagttct 
tgcgctctgc 
caaaccaccg 4200 
aaaggatctc 4260 
aactcaegtt 4320 
ttaaattaaa 4380 
agttaccaat 4440 
atagttgect 4500 
cccagtgctg 4560 
aaccagccag 4620 
cagtctatta 4680 
aacgttgttg 4740 
ttcagctccg 4800 



ggtgagcaaa aacaggaagg 
gttgaatact catactcttc 
teatgagegg atacatattt 
catttccccg aaaagtgcca 
taaatttttg ttaaatcagc 
ataaatcaaa agaatagacc 
cactattaaa gaacgtggac 
gcccactacg tgaaccatca 
taaatcggaa ccctaaaggg 
tggcgagaaa ggaagggaag 
cggtcacgct gcgcgtaacc 
cccattcgcc a 



gggagggctt accatctggc 
ctccagattt atcagcaata 
caactttatc cgcctccatc 
cgccagtfcaa tagtttgege 
cgtcgtttgg tatggcttca 

cccccatgtt. gtgcaaaaaa gcggttagct 4860 
agttggccgc agtgttatca ctcatggtta 4920 
tgccatccgt aagatgcttt 
agtgfcatgcg gcgaccgagt 
atagcagaac tttaaaagtg 
ggatcttacc gctgttgaga 
cagcatcttt tactttcacc 
caaaatgecg caaaaaaggg aataagggcg 
ctttttcaat attattgaag catttatcag 
gaatgtattt agaaaaataa acaaataggg gttccgcgca 
cctgaaattg taaacgttaa tattttgtta aaattcgcgt 
tcatttttta accaataggc egaaategge aaaatccctt 
gagatagggt tgagtgttgt tccagtttgg aacaagagtc 
tccaacgtca aagggcgaaa aacegtctat cagggegatg 
ccctaatcaa gttttttggg gticgaggtgc cgtaaagcac 
agcccccgat ttagagcttg aeggggaaag ccggcgaacg 5760 
aaagcgaaag gagegggege tagggegctg gcaagtgtag 5820 
accacacccg ccgcgcttaa tgcgccgcta cagggegegt 5880 

5891 



tctgtgactg 4980 
tgctcttgcc 5040 
ctcatcattg 5100 
tccagttcga 5160 
agcgtttctg 5220 
acaeggaaat 5280 
ggttattgtc 5340 
5400 
5460 
5520 
5580 
5640 
5700 
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<210> 44 
<211> 2617 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: vecteur 
d' expression pT7-7-dp-Pt (TME1) 

<400> 44 

aattctcatg tttgacagct tatcatcgat gataagcttg ggctgcaggt cgactctaga 60 
ggatccccgg gcgcgaattc ctaagcgtca acaccagcga acagcagcag aacaaccaga 120 
actttagccc agttaccaac catagagaag taagcgatac cagccagaac accccagtga 180 - 
gcaccagcga tcgggtccat atgtatatct ccttcttaaa gttaaacaaa attatttcta 240 . 
gagggaaacc ^gttgtggtct ccctafcagtg agtcgtatta atttcgaagt ctatcagaag 300 
ttcgaatcgc tgggcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 360 
ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 420 
ggcgcgtcag cgggtgttgg c^ggtgtcgg ggcgcagcca tgacccagtc acgtagcgat 480 
adjcggagtgt atatactggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 540 
ccataggaag atcttccgga agatcttcct- atgcggtgtg aaata*ccgca cagatgcgta 600 
aggagaaaat accgcatcag %cgctcttcc gcttcctcgc tcactgactc gctgcgctcg 660 
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 720 
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 780 
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga "cgagcatcac 840 
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 900 
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 960 
ctgtccgcct ttctcccttc . gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 1020 
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 1080 
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 1140 
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 1200 
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 1260 
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 1320 
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 1380 
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 1440 
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 1500 
cttttaattc ttgaagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 1560 
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 1620 
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 1680 
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg i740 
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 1800 
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 1860 
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 192 0 
cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg caagagcaac 1980 
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 2040 
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 2100 
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 2160 
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 2220 
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 2280 
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 2340 
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 24 00 
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 2460 
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 2520 
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 2580 
cagaccaagt ttactcatat atactttaga ttgattt 2617 



<210> 45 
<211> 2599 
<212> ADN 
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<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : vecteur 
d 1 expression pT7-7-dp-Pt (TME2) 

<400> 45 

aattctcatg tttgacagct tatcatcgat gataagcttg ggctgcaggt cgactctaga 60 
ggatccccgg gcgcgaattc ctaagcttca gcctgagaga tcagcagcat catccacagg 120 
caagagcaaa cacgagcgtc agccagcagc aggaacagca gaacaacgta ttccgggtcc 180 
*• etgtatat ctccttctta aagttaaaca aaattatttc tagagggaaa ccgttgtggt 240 
. ^cctatag tgagtcgtat taatttcgaa gtctatcaga agttcgaatc gctgggcctc 300 
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 360 
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 420 
oacgggtgtc ggggcgcagc catgacccag tcacgtagcg .atagcggagt gtatatactg 480 
3 ttaactat gcggcatcag agcagattgt actgagagtg caccatagga agatcttccg 540 
3*agatcttc ctatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc 600 
* . /cgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 660 
^gtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 720 
-craaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 780 
^.ggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 840 
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 900 
utcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 960 
tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc 1020 
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 1080 
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca li40 
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 1200 
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 1260 
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 1320 
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 1380 
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 1440 
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaat tcttgaagac 1500 
gaaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt 1560 
agacgtcagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct 1620 
aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 1680 
attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 1740 
cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 1800 
aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc 1860 
ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat 1920 
gtggcgcggt attatcccgt gttgacgccg ggcaagagca actcggtcgc cgcatacact 198 0 
; attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca 2040 
tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact 210 0 
tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg 2160 
atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg 222 0 
agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg 228 0 
aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg 2340 
caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag 2400 
ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc 2460 
gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga 2520 
tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat 258 0 
atatacttta gattgattt 2599 



<210> 46 
<211> 271 
<212> PRT 



<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: prot^ine 
de fusion GST-DP-TME1 
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<400> 46 

Met Ser Pro lie Leu Gly Tyr Trp Lys lie Lys Gly Leu Val Gin Pro 
1 5 10 15 

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 
20 25 30 

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 
35 40 .45 

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr He Asp Gly Asp Val Lys 
50 55 60 

Leu Thr Gin Ser Met Ala He He Arg Tyr He Ala Asp Lys His Asn 

65 70 75 80 

* 

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu lie Ser Met Leu Glu 
85. 90 95 

** 

Gly Ala Val Leu Asp He Arg Tyr Gly Val Ser Arg lie Ala Tyr Ser 
100 • *105 .110' 

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 
115 120 125 

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 
130 135 140 

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 
145 150 155 160 

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 
165 170 175 

Val Cys Phe Lys Lys Arg He Glu Ala lie Pro Gin lie Asp Lys Tyr 
180 185 190 

Leu Lys Ser Ser Lys Tyr lie Ala Trp Pro Leu Gin Gly Trp Gin Ala 
195 • 200 205 

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Ser Gly Gly 
.210 215 220 

Gly Gly Gly Leu Val Pro Arg Gly Ser Asp Pro He Ala Gly Ala His 
225 230 235 240 

Trp Gly Val Leu Ala Gly He Ala Tyr Phe Ser Met Val Gly Asn Trp 
245 250 255 

Ala Lys Val Leu Val Val Leu Leu Leu Phe Ala Gly Val Asp Ala 
260 265 270 



<210> 47 
<211> 265 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: prot^ine 
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de fusion GST-DP-TME2 
<400> 47 

Met Ser Pro lie Leu Gly Tyr Trp Lys He Lys Gly Leu Val Gin Pro 
1 5 10 15 

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 
20 25 30 

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 

35 40 . 45 " 

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr He Asp Giy Asp Val Lys 
50 * 55 ' 60 

Leu Thr Gin Ser Met Ala lie He Arg' Tyr He ' Ala Asp Lys His Asn 
65 70 . 75 80 

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu lie Ser Met Leu Glu 
85 90 , 95 

« ■ • 

Gly Ala Val Leu Asp lie Arg Tyr Gly Val Ser Arg lie Ala Tyr Ser 
100 105 HO 

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 
115 . ' 120 125 

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 
130 " 135 140 

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 
145 150 155 . 160 

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 
165 170 175 

Val Cys Phe Lys Lys Arg He Glu Ala He Pro Gin He Asp Lys Tyr 
180 185 190 

Leu Lys Ser Ser Lys Tyr He Ala Trp Pro Leu Gin Gly Trp Gin Ala 
195 200 205 

Thr Phe Gly Gly' Gly Asp His Pro Pro. Lys Ser Asp Leu Ser Gly Gly 
210 215 220 

Gly Gly Gly Leu Vai Pro Arg Gly Ser Asp Pro Glu Tyr Val Val Leu 
225 230 235 240 

Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Cys Leu Trp Met 
245 250 • 255 

Met Leu Leu He Ser Gin Ala Glu Ala 
260 265 



<210> 48 
<211> 170 
<212> PRT 

<213> S§quence artificielle 
<220> 
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<223> Description de la sequence artif icielle : proteine 
de fusion TrX-DP-TMEl 

<400> 48 

Met Ser Asp Lys lie He His Leu Thr Asp Asp Ser Phe Asp Thr Asp 
1 5 10 15 

Val Leu Lys Ala Asp Gly Ala He Leu Val Asp Phe Trp Ala Glu Trp 
20 25 30 

Cys Gly Pro Cys Lys Met He Ala Pro He Leu Asp Glu He Ala Asp 
35 40 45 

Glu Tyr Gin Gly Lys Leu Thr Val Ala Lys Leu Asn He Asp Gin Asn 
50 55 60 

Pro Gly Thr Ala Pro Lys Tyr Gly He Arg Gly lie Pro Thr Leu Leu 
; 65 70 75 80 

Leu Phe Lys Asn Gly Glu Vai Ala Ala Thr Lys Val Gly Ala Leu Ser 
85 .90 . 95 * 

Lys Gly Gin Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly 
100 * 105 110* 

Ser Gly Ser Pro Lys Ser Asp Leu Ser Gly Gly'Gly Gly Gly Leu Val 
115 120 125* 

Pro Arg Gly Ser Asp Pro He Ala Gly Ala His Trp Gly Val Leu Ala 
130 135 140. 

Gly He. Ala Tyr Phe Ser Met Val Gly Asn Trp Ala Lys Val Leu Val 
145 150 155 160 

Val Leu Leu Leu Phe Ala Gly Val Asp Ala 
165 * 170 



<210> 49 
<211> 161 
<212> PRT 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : proteine 
de fusion TrX-DP~TME2 

<400> 49 

Met Ser Asp Lys He He His Leu Thr Asp Asp Ser Phe Asp Thr Asp 
15 10 15 

Val Leu Lys Ala Asp Gly Ala He Leu Val Asp Phe Trp Ala Glu Trp 
20 25 30 

Cys Gly Pro Cys Lys Met He Ala Pro He Leu Asp Glu He Ala Asp 
35 40 45 

Glu Tyr Gin Gly Lys Leu Thr Val Ala Lys Leu Asn He Asp Gin Asn 
50 55 60 

Pro Gly Thr Ala Pro Lys Tyr Gly He Arg Gly He Pro Thr Leu Leu 
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65 70 75 80 

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 
85 90. 95 

Lys Gly Gin Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly 
100 105 110 

Ser Gly Ser Asp Leu Ser Gly Gly Gly Gly Gly Leu Val Pro Arg Gly 
115 120 * 125 

Ser Asp Pro Glu Tyr Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala 
130 135 140 

Arg Val Cys Ser Cys Leu Trp Met Met Leu Leu. lie Ser Gin Ala Glu 
145 150 155 160 

Ala 



<210> 50 

<211> 39 % 
<212> PRT 

<213> Sequence artificielle _ m 

• 

<220> 

<223> Description de la sequence artificielle: prot^ine 
de fusion- M-DP-TME1 

<400> 50 

Met . Asp Pro He Ala Gly Ala His Trp Gly Val Leu Ala Gly He Ala 
1 5 10 .15 

Tyr Phe Ser Met Val Gly Asn Trp Ala Lys Val Leu Val Val Leu Leu 
20 25 30 

Leu Phe Ala Gly Val Asp Ala 
35 



<210> 51 
<211> 33 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: prot§ine 
de fusion M-DP-TME2 

<400> 51 

Met Asp Pro Glu Tyr Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala 
1 5 10 15 

Arg Val Cys Ser Cys Leu Trp Met Met Leu Leu lie Ser Gin Ala Glu 
20 25 30 

Ala 
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<210> 52 
<211> 239 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
glutathion transferase (GST) 

<400> 52 

Met Ser Pro lie Leu Gly Tyr Trp Lys He Lys Gly Leu Val Gin Pro 
1 5 10 15 

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 
20 25 30 

* 

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 
35 40 45 . 

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr He Asp Gly Asp Val Lys 

50 55 •-■ 60 

Leu Thr Gin Ser Met Ala lie lie' Arg Tyr lie Ala Asp Lys His Asn 
65 70 * 75 80 

Met Leu Gly Gly Cys Pro Lys Glu Arg Aj.a Glu He Ser Met Leu Glu 
* 85 ' 90 * 95 . 

Gly Ala Val Leu Asp He Arg Tyr Gly Val Ser Arg lie Ala Tyr Ser 
100 ~ 105 110 

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 
115 120 125 

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 
130 135 140 

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 
145 150 155 160 

Val Val Leu Tyr Met Asp Pro Met Cys Leu "Asp Ala Phe Pro Lys Leu 
165 170 175 

Val Cys Phe Lys Lys . Arg He Glu Ala. He Pro Gin He Asp Lys Tyr 
180 185 190 

Leu Lys Ser Ser Lys Tyr He Ala Trp Pro Leu Gin Gly Trp Gin Ala 
195 200 205 

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Ser Gly Gly 
210 215 220 

Gly Gly Gly Leu Val Pro Arg Gly Ser Pro Gly He His Arg Asp 
225 230 235 



<210> 53 
<211> 170 
<212> PRT 

<213> Sequence artificielle 
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<220> 

<223> Description de la sequence art if icielle : 
thior£doxine (TrX) 

<400> 53 

Met Ser Asp Lys He He His Leu Thr Asp Asp Ser Phe Asp Thr Asp 
1 5 10 15 

Val Leu Lys Ala Asp Gly Ala He Leu Val Asp Phe Trp Ala Glu Trp 
20 25 30 

/3 Gly Pro Cys Lys Met He Ala Pro He Leu Asp Glu He Ala Asp 
35 40 45 

Glu Tyx Gin Gly Lys Leu Thr Val Ala Lys Leu. Asn He Asp Gin Asn 
50 55 60 

Gly Thr Ala Pro Lys Tyr Gly He Arg Gly He Pro Thr Leu Leu 
$ 70 75 80 

Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 
85 . 90 95 

Lys Gly Gin Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly 
100 105 . 110 

Ser Gly Ser Pro Lys Ser Asp Leu Ser Gly^Gly Gly Gly Gly Leu Val 
115 120 ?25 

Pro Arg Gly Ser Asp Pro He Ala Gly Ala His Trp Gly Val Leu Ala 
130 135 140 

Gly He Ala Tyr Phe Ser Met Val Gly Asn Trp Ala Lys Val Leu Val 
145 150 155 160 

Val Leu Leu Leu Phe Ala Gly Val Asp Ala 
165 170 
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